python pandas - ghdrako/doc_snipets GitHub Wiki

Modin to narzędzie zaprojektowane w celu przyspieszenia operacji na danych w Pythonie poprzez równoległe przetwarzanie, jednocześnie zachowując pełną kompatybilność z istniejącym kodem napisanym z użyciem biblioteki pandas. Dzięki Modin możesz znacząco zwiększyć wydajność swoich analiz danych bez konieczności modyfikowania dotychczasowego kodu. boringowl.io

W przeciwieństwie do Modin, Polars to inna biblioteka do analizy danych, która oferuje wysoką wydajność, ale posiada własne API, różniące się od pandas. Oznacza to, że migracja do Polars wymagałaby przepisania istniejącego kodu.

DataFrame

  • Two-dimensional data structure.
  • Heterogeneous data (columns can have different data types).
  • Indexed by both row and column labels.
  • Supports advanced operations like filtering, grouping, and merging.
 data = {'Name': ['Alice', 'Bob', 'Charlie'],
         'Age': [25, 30, 35], 
         'City': ['New York', 'Los Angeles', 'Chicago']}
 df = pd.DataFrame(data)
 print(df)

Reading and Writing Data

  • CSV Files
 df = pd.read_csv('data.csv')
 df.to_csv('output.csv', index=False)
  • Excel Files
 df = pd.read_excel('data.xlsx', sheet_name='Sheet1')
 df.to_excel('output.xlsx', sheet_name='Sheet1')
  • SQL Databases
 import sqlite3
 conn = sqlite3.connect('database.db')
 df = pd.read_sql('SELECT * FROM table_name', conn)
 df.to_sql('table_name', conn, if_exists='replace', index=False)