#author("2020-07-03T01:25:30+00:00","default:f-lab","f-lab") [[個人ページ>seminar-personal/chin2017]] &br; [[N班ゼミ>http://f-lab.mydns.jp/index.php?seminar-N-2020]] |~目次| |#contents| &br; *支部大会 [#n59d513d] -題目(和文、英文) --和文 --英文 -アブストラクト(300文字以内) --最近,新型コロナウイルスにより,台湾のオープンデータを活用したマスク在庫管理マップアプリが話題となった.世界的にオープンデータへの関心が高まりつつある.オープンデータの活用が推進され,国や地方自治体をはじめ多くの団体がオープンデータの公開,活用に取り組んでいる.地方自治体のオープンデータは,データ形式・フォーマットの違いにより開示されても積極的な活用まで至っていないのが現状である.本研究では,RDFに焦点を当てて,述語の語彙共通化を行うため,オープンデータの項目名をクラスタリングし,割り当てられたカテゴリを教師信号として入力し,深層学習を行い,述語のサジェストを提案する.(287文字) -電子情報通信学会 --会員番号:1715909 --学生会員保持:4,500円(6月22日に支払い済) *ゼミより抜粋 [#x56e0c04] **クラスタリングのパラメータについて [#j7f01f5a] -methodは現在はaverage -&color(red){これをsingleにしたらどうなるか?}; **クラスタ内の単語数についての検討 [#f4963093] -なぜ類似度の低い単語が同じクラスタに入っているのか? --&color(red){同じクラスタ内の単語間のcos類似度を計算して、分布をみる。}; *進捗状況 [#k9c3dcd1] **1) [#d923f8c0] -[[距離計算手法(averageとsingle)>https://qiita.com/pontyo4/items/a2e7dec57c3699c519a5]] -クラスタリングはデータ同士の距離に基づいて, データをグループ分ける. -average:重みのない平均距離 -single:最小距離 **2) [#uc3a39d6] -[[距離関数の定義>https://qiita.com/obake_kaiware/items/36104a479582063308f0]] -式: --&ref(chin2017-20200703/コサイン類似度.JPG,80%); *参考資料 [#h6872381] -1,[[距離とクラスタリング>https://www.slideshare.net/ssuserf64eb4/ss-129049925]] -2,[[数学のコサイン類似度>https://mathtrain.jp/cosdistance]]