Pythonでの下流解析はじめ - Yokohide0317/2024_BI-Zissen GitHub Wiki
Qiime2の後、発表用のグラフを描いたり、他の統計手法を使う場合は、
結果をcsvファイル(タブ区切りの表データ)として出力し、Python
やR
、Julia
などで行う事が多い。
今回はPythonを使い、Jupyter環境でデータを見ながらQiime2での解析を振り返りつつ、
「読み込み」と「簡単な可視化」を行う。
Warning
pd.read_csv("....", index_col=0)
の部分は、出力されたcsvの置き場所をしていするため、
解析の度・人によって違うはずです。ls
やpwd
コマンドなどで、ファイルのパスを確かめる必要があります。
※ 今回の実習では、"./diverse-tutorial/qiime_outputs/taxa-outputs/level-3.csv" になると思います。
# csvファイルの読み込み
pd.read_csv("<path>/<to>/<csv>.csv")
# ※Excelファイルを読み込む場合
pd.read_excel("<path>/<to>/<excel>.xlsx")
# DataFrameの中身、頭から10件を表示
df.head(10)
# 列(縦)を選択。(column_name1 と column_name2 の2つを想定)
df[["column_name1", "column_name2"]]
# 行(横)を選択。(row_nameを想定)
df.loc["row_name"]
# 統計情報を表示
df.describe()
# 合計値を表示
df.sum()
# 逆方向
df.sum(axis=1)