個人ページ
N班ゼミ
支部大会 †
- 題目:オープンデータの述語サジェストのための項目名のクラスタリングの研究
- 英語:A study on the clustering of item names for predicate suggestion of Open Data
- 概要:最近,新型コロナウイルスにより,台湾のオープンデータを活用したマスク在庫管理マップアプリが話題となった.世界的にオープンデータへの関心が高まりつつある.オープンデータの活用が推進され,国や地方自治体をはじめ多くの団体がオープンデータの公開,活用に取り組んでいる.地方自治体のオープンデータは,データ形式・フォーマットの違いにより開示されても積極的な活用まで至っていないのが現状である.本研究では,RDFに焦点を当てて,適切な述語をサジェストするために,オープンデータの項目名を抽出し,Word2Vecで得られた単語ベクトルを使用し,階層的クラスタリングを行った。(272文字)
ゼミより抜粋 †
- k-means法でやると違いがあるか?
- k-means++法は?
- 他のクラスタも同様な傾向なのか?
- 異なるクラスタ間の類似度の分布はどうなっているか?
進捗報告 †