#author("2019-12-21T05:58:50+00:00","default:f-lab","f-lab") #author("2019-12-21T05:59:14+00:00","default:f-lab","f-lab") [[seminar-personal/chin2017]] |~目次| |#contents| &br; *進捗報告 [#o2dde426] -渕田先生より指摘していただいたデータ上のノイズについて -クラスに含めている項目名の数を統計 --[[ソースコード>https://colab.research.google.com/drive/1RRtd1pfwlHhi7s0HUt4kTy8jz7AOYIQ1#scrollTo=CO4alwLGqrQV]]&ref(count.txt); --&ref(chin2017-20191221/cluster_count.JPG,100%); -全データセットに上記のクラスタが出現回数を統計 -‐&ref(chin2017-20191221/cluster_count.JPG,100%); --&ref(chin2017-20191221/cluster_count_all_dataset.JPG,100%); *クラスタを使用する場合 [#wf3c542a] -acc:0.7~0.8 -&ref(chin2017-20191221/50_acc_with_cluster.png,100%); -&ref(chin2017-20191221/50_loss_with_cluster.png,100%); *クラスタを使用せず [#a04862a2] -[[ラベル処理>http://www.mwsoft.jp/programming/numpy/scikit_features.html]] -[[ソース>https://colab.research.google.com/drive/1yp19NpRu7Z1bTpGOnBK1KDHEtAfhm5Ps#scrollTo=dhE7ovMqZBrT]] -結果 |テストデータ|予測(項目名)| |鹿児島市市立病院|表示内容| |鹿児島|店舗名| |熊本|店舗名| |西田2-29-1|住所| |鹿児島大学|名称| |南国センタービル|店舗名| |大正小学校|名称| |鳥取市立中ノ郷地区公民館|表示内容| -acc:0.65~0.68 -&ref(chin2017-20191221/20_acc_without_cluster.png,100%); -&ref(chin2017-20191221/20_loss_without_cluster.png,100%); *正規表現の修正(項目名) [#g507abc2] 大 中 部 分 男 女 田 豚 音 一 総 金 題 科 目 棟 ... -除外? re.search("^[\s\S]{0,1}$",item):#1文字のみ