python pandas - ghdrako/doc_snipets GitHub Wiki
- https://www.askpython.com/python-modules/pandas/conditionally-grouping-values
- https://github.com/FisherKK/Portfolio/blob/master/Showcases/Data%20Engineering/Pandas%20IO%20Formats%20Comparison/Pandas%20IO%20Formats%20Comparison.ipynb
- https://analityk.edu.pl/python-pandas-mega-tutorial/
Modin to narzędzie zaprojektowane w celu przyspieszenia operacji na danych w Pythonie poprzez równoległe przetwarzanie, jednocześnie zachowując pełną kompatybilność z istniejącym kodem napisanym z użyciem biblioteki pandas. Dzięki Modin możesz znacząco zwiększyć wydajność swoich analiz danych bez konieczności modyfikowania dotychczasowego kodu. boringowl.io
W przeciwieństwie do Modin, Polars to inna biblioteka do analizy danych, która oferuje wysoką wydajność, ale posiada własne API, różniące się od pandas. Oznacza to, że migracja do Polars wymagałaby przepisania istniejącego kodu.
DataFrame
- Two-dimensional data structure.
- Heterogeneous data (columns can have different data types).
- Indexed by both row and column labels.
- Supports advanced operations like filtering, grouping, and merging.
data = {'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['New York', 'Los Angeles', 'Chicago']}
df = pd.DataFrame(data)
print(df)
Reading and Writing Data
- CSV Files
df = pd.read_csv('data.csv')
df.to_csv('output.csv', index=False)
- Excel Files
df = pd.read_excel('data.xlsx', sheet_name='Sheet1')
df.to_excel('output.xlsx', sheet_name='Sheet1')
- SQL Databases
import sqlite3
conn = sqlite3.connect('database.db')
df = pd.read_sql('SELECT * FROM table_name', conn)
df.to_sql('table_name', conn, if_exists='replace', index=False)