seminar-personal/chin2017

モテルの作成

  • gemsimのword2vecのオプション一覧
  • 使い方
    # -*- coding: utf-8 -*-
    from gensim.models import Word2Vec
    import logging
    import sys
    logging.basicConfig(format='%(asctime)s:%(levelname)s:%(message)s',level=logging.INFO)
    f_input="l-teacher-20180206-3.txt"
    model = Word2Vec(corpus_file=f_input,sg=0,size=50)
    f_output="gw_20180206-3_cbow_50.model"
    model.save(f_output)
    print(model)
  • モデルを使用
    from gensim.models import Word2Vec
    import sys
    model = Word2Vec.load(sys.argv[1])
    results = model.most_similar(positive =sys.argv[2],topn=10)
    print(model)
    for result in results:
         print(result[0],'\t',result[1])

調査

  • 使えるデータが、地自体がどこか?
  • 調べてみる。
  • fileken_list.txt
    • 14286
    • 鳥取県
    • 宮崎県
    • 徳島県オープンデータ(Our Open Data)」
    • 神奈川県綾瀬市
    • 神奈川県秦野市
    • 千葉県印西市
    • 千葉市
    • 文京区
    • 旭川市
    • 兵庫県芦屋市http://www.city.ashiya.lg.jp/
    • 茅ヶ崎市
    • 坂井市
    • 調布市
    • 知多市
    • 東京都府中市
    • 東京都東久留米市
    • 東京都八王子市
    • 東京都板橋区
    • 橋本市
    • 愛知県半田市
    • 北海道函館市
    • 東京都東村山市
    • 山口県防府市
    • 広島市
    • 愛知県一宮市
    • 東京都稲城市
    • 神奈川県平塚市
    • 愛媛県今治市
    • 福生市
    • 鹿児島市
    • 新潟県上越市
    • 和歌山県海南市
    • 鎌倉市
    • いわき市
    • ...

添付ファイル: fileken_list.txt 599件 [詳細]

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2020-03-25 (水) 20:54:03