Pythonでの下流解析はじめ - Yokohide0317/2024_BI-Zissen GitHub Wiki

概要

Qiime2の後、発表用のグラフを描いたり、他の統計手法を使う場合は、
結果をcsvファイル(タブ区切りの表データ)として出力し、PythonRJuliaなどで行う事が多い。

今回はPythonを使い、Jupyter環境でデータを見ながらQiime2での解析を振り返りつつ、
「読み込み」と「簡単な可視化」を行う。

01. 百分率化

01_hyakubunritsu.ipynb

Warning

pd.read_csv("....", index_col=0)の部分は、出力されたcsvの置き場所をしていするため、
解析の度・人によって違うはずです。lspwdコマンドなどで、ファイルのパスを確かめる必要があります。
※ 今回の実習では、"./diverse-tutorial/qiime_outputs/taxa-outputs/level-3.csv" になると思います。

pandas(pd)ライブラリの使い方の例

# csvファイルの読み込み
pd.read_csv("<path>/<to>/<csv>.csv")
# ※Excelファイルを読み込む場合
pd.read_excel("<path>/<to>/<excel>.xlsx")


# DataFrameの中身、頭から10件を表示
df.head(10)


# 列(縦)を選択。(column_name1 と column_name2 の2つを想定)
df[["column_name1", "column_name2"]]


# 行(横)を選択。(row_nameを想定)
df.loc["row_name"]


# 統計情報を表示
df.describe()

# 合計値を表示
df.sum()

# 逆方向
df.sum(axis=1)

02.

⚠️ **GitHub.com Fallback** ⚠️