#author("2020-03-25T11:53:51+00:00","default:f-lab","f-lab") #author("2020-03-25T11:54:03+00:00","default:f-lab","f-lab") [[seminar-personal/chin2017]] *モテルの作成 [#edf42a61] -[[gemsimのword2vecのオプション一覧>https://qiita.com/mergit/items/822dc49343c887019d44]] -[[使い方>https://www.pytry3g.com/entry/gensim-word2vec-tutorial]] # -*- coding: utf-8 -*- from gensim.models import Word2Vec import logging import sys logging.basicConfig(format='%(asctime)s:%(levelname)s:%(message)s',level=logging.INFO) f_input="l-teacher-20180206-3.txt" model = Word2Vec(corpus_file=f_input,sg=0,size=50) f_output="gw_20180206-3_cbow_50.model" model.save(f_output) print(model) -モデルを使用 from gensim.models import Word2Vec import sys model = Word2Vec.load(sys.argv[1]) results = model.most_similar(positive =sys.argv[2],topn=10) print(model) for result in results: print(result[0],'\t',result[1]) *調査 [#x70d95be] -使えるデータが、地自体がどこか? -調べてみる。 -&ref(ken_list.txt); --14286 |リンク|都道府県|件数| --鳥取県 --宮崎県 --徳島県オープンデータ(Our Open Data)」 --神奈川県綾瀬市 --神奈川県秦野市 --千葉県印西市 --千葉市 --文京区 --旭川市 --兵庫県芦屋市http://www.city.ashiya.lg.jp/ --茅ヶ崎市 --坂井市 --調布市 --知多市 --東京都府中市 --東京都東久留米市 --東京都八王子市 --東京都板橋区 --橋本市 --愛知県半田市 --北海道函館市 --東京都東村山市 --山口県防府市 -- 広島市 --愛知県一宮市 --東京都稲城市 --神奈川県平塚市 --愛媛県今治市 --福生市 --鹿児島市 --新潟県上越市 --和歌山県海南市 --鎌倉市 --いわき市 --...