#author("2019-12-21T05:58:50+00:00","default:f-lab","f-lab")
#author("2019-12-21T05:59:14+00:00","default:f-lab","f-lab")
[[seminar-personal/chin2017]]

|~目次|
|#contents|
&br;
*進捗報告 [#o2dde426]
-渕田先生より指摘していただいたデータ上のノイズについて
-クラスに含めている項目名の数を統計
--[[ソースコード>https://colab.research.google.com/drive/1RRtd1pfwlHhi7s0HUt4kTy8jz7AOYIQ1#scrollTo=CO4alwLGqrQV]]&ref(count.txt);
--&ref(chin2017-20191221/cluster_count.JPG,100%);
-全データセットに上記のクラスタが出現回数を統計
-‐&ref(chin2017-20191221/cluster_count.JPG,100%);
--&ref(chin2017-20191221/cluster_count_all_dataset.JPG,100%);
*クラスタを使用する場合 [#wf3c542a]
-acc:0.7~0.8
-&ref(chin2017-20191221/50_acc_with_cluster.png,100%);
-&ref(chin2017-20191221/50_loss_with_cluster.png,100%);
*クラスタを使用せず [#a04862a2]
-[[ラベル処理>http://www.mwsoft.jp/programming/numpy/scikit_features.html]]
-[[ソース>https://colab.research.google.com/drive/1yp19NpRu7Z1bTpGOnBK1KDHEtAfhm5Ps#scrollTo=dhE7ovMqZBrT]]
-結果
|テストデータ|予測(項目名)|
|鹿児島市市立病院|表示内容|
|鹿児島|店舗名|
|熊本|店舗名|
|西田2-29-1|住所|
|鹿児島大学|名称|
|南国センタービル|店舗名|
|大正小学校|名称|
|鳥取市立中ノ郷地区公民館|表示内容|
-acc:0.65~0.68
-&ref(chin2017-20191221/20_acc_without_cluster.png,100%);
-&ref(chin2017-20191221/20_loss_without_cluster.png,100%);

*正規表現の修正(項目名) [#g507abc2]
 大
 中
 部
 分
 男
 女
 田
 豚
 音
 一
 総
 金
 題
 科
 目

 ...
-除外?
 re.search("^[\s\S]{0,1}$",item):#1文字のみ

トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS