seminar-personal/chin2017


進捗報告

  • 渕田先生より指摘していただいたデータ上のノイズについて
  • クラスに含めている項目名の数を統計
  • 全データセットに上記のクラスタが出現回数を統計
  • cluster_count.JPG
    • cluster_count_all_dataset.JPG

クラスタを使用する場合

  • acc:0.7~0.8
  • 50_acc_with_cluster.png
  • 50_loss_with_cluster.png

クラスタを使用せず

  • ラベル処理
  • ソース
  • 結果
    テストデータ予測(項目名)
    鹿児島市市立病院表示内容
    鹿児島店舗名
    熊本店舗名
    西田2-29-1住所
    鹿児島大学名称
    南国センタービル店舗名
    大正小学校名称
    鳥取市立中ノ郷地区公民館表示内容
  • acc:0.65~0.68
  • 20_acc_without_cluster.png
  • 20_loss_without_cluster.png

正規表現の修正(項目名)

大
中
部
分
男
女
田
豚
音
一
総
金
題
科
目
棟
...
  • 除外?
    re.search("^[\s\S]{0,1}$",item):#1文字のみ

添付ファイル: filecount.txt 230件 [詳細] file50_loss_with_cluster.png 177件 [詳細] file50_acc_with_cluster.png 175件 [詳細] filecluster_count_all_dataset.JPG 158件 [詳細] filecluster_count.JPG 176件 [詳細] file20_loss_without_cluster.png 146件 [詳細] file20_acc_without_cluster.png 157件 [詳細]

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2019-12-21 (土) 14:59:14