chin2017-20200703
のバックアップ(No.4)
[
トップ
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
|
ログイン
]
バックアップ一覧
差分
を表示
現在との差分
を表示
ソース
を表示
chin2017-20200703
へ行く。
1 (2020-07-03 (金) 07:34:54)
2 (2020-07-03 (金) 07:36:56)
3 (2020-07-03 (金) 18:09:28)
4 (2020-07-03 (金) 21:18:06)
5 (2020-07-03 (金) 23:02:43)
6 (2020-07-04 (土) 03:46:55)
個人ページ
N班ゼミ
目次
支部大会
ゼミより抜粋
クラスタリングのパラメータについて
クラスタ内の単語数についての検討
進捗状況
1)
2)
参考資料
支部大会
†
題目(和文、英文)
和文
英文
アブストラクト(300文字以内)
最近,新型コロナウイルスにより,台湾のオープンデータを活用したマスク在庫管理マップアプリが話題となった.世界的にオープンデータへの関心が高まりつつある.オープンデータの活用が推進され,国や地方自治体をはじめ多くの団体がオープンデータの公開,活用に取り組んでいる.地方自治体のオープンデータは,データ形式・フォーマットの違いにより開示されても積極的な活用まで至っていないのが現状である.本研究では,RDFに焦点を当てて,述語の語彙共通化を行うため,オープンデータの項目名をクラスタリングし,割り当てられたカテゴリを教師信号として入力し,深層学習を行い,述語のサジェストを提案する.(287文字)
電子情報通信学会
会員番号:1715909
学生会員保持:4,500円(6月22日に支払い済)
↑
ゼミより抜粋
†
↑
クラスタリングのパラメータについて
†
methodは現在はaverage
これをsingleにしたらどうなるか?
↑
クラスタ内の単語数についての検討
†
なぜ類似度の低い単語が同じクラスタに入っているのか?
同じクラスタ内の単語間のcos類似度を計算して、分布をみる。
↑
進捗状況
†
↑
1)
†
距離計算手法(averageとsingle)
クラスタリングはデータ同士の距離に基づいて, データをグループ分ける.
average:重みのない平均距離
single:最小距離
↑
2)
†
距離関数の定義
式:
↑
参考資料
†
1,
距離とクラスタリング
2,
数学のコサイン類似度