pythonではじめる機械学習の勉強 P75のIn[58],In[59]を詳しく

In[58]

export_graphviz(tree,out_file="tree.dot",class_names=["malignant","benign"],feature_names=cancer.feature_names,impurity=False,filled=True)

・out_fileがファイル名。
・filled=Trueで分岐のときにノードを色わけしてくれる。
・class_namesは指定しないclass名が表示されない。
・fature_namesは指定しないと特徴量の名前がX[0],X[1]..になる。
・impurityがTrueだと不純度が追加されて、これはginiで表示される。これはgini係数というもので誤分類(間違って分類する)をどれくらいするかを表す。
https://qiita.com/takahashi_yukou/items/5251bada1c3dc453c508https://qiita.com/Hawaii/items/53efe3e96b1171ebc7dbを参照。

In[59]
with open でファイルを開く。graphviz.Source(dot_graph) でグラフを表示。