#author("2020-02-14T04:41:55+00:00","default:f-lab","f-lab")
#author("2020-02-14T07:03:25+00:00","default:f-lab","f-lab")
[[seminar-personal/chin2017]]
 少ないクラスタに入っているオープンデータはどんなデータか?
 項目データの数ではなく、項目名の少ないクラスタを調査する。
上記の調査
[[前回のゼミ>http://f-lab.mydns.jp/index.php?chin2017-20191221]]
-項目名の少ないクラスタ(1個項目名のみ)
 北中	4
 当落	7
 で医療対	13
 はくさい	19
 しろあり	20
 る世帯	38
 う	39
 動機付け支援	46
 年別	57
 役目	63
 困りごと・心配ごと	99
 残留農薬	110
--ソースコードで抽出
--&ref(chin2017-20200214/items_name_all_vec_150_191212.csv);
 import pandas as pd
 FNAME="items_name_all_vec_150_191212.csv"
 print(" CSV of item data reading...")
 df=pd.read_csv(FNAME,sep=",",encoding="utf-8-sig",header =None) #項目データ 項目名ペアを読み込み
 print(df)
 len_df=len(df)
 dict ={}
 #回数を統計
 dict ={}
 for m in range(df.shape[0]):#行数クラスタリングの分布
     name = df.iat[m,0]#項目名
     label=df.iat[m,51]#クラスタのラベル
     if label in dict.keys():
         dict[label].append(name)
     else:
         dict[label]=[name]
 print(dict)
 print(len(dict))
 for i in range(1,151):
     if len(dict[i]) <= 5:
         print(i,dict[i])
-結果(5個項目名以下のクラスタ)
 
クラスタ 項目名
 1 ['せ', 'せ用']
 4 ['北中']
 5 ['なす', '見出し']
 6 ['歳入出', '県内の出']
 7 ['当落']
 9 ['仕事に', '仕事', '単身', 'ひとり暮らし', 'ずっと住み続けたい']
 10 ['離別', '離婚', '婚姻']
 12 ['統計で見るつづき', '新鮮でおいしければ']
 13 ['で医療対']
 14 ['障がい程度', 'いる', '障がい名']
 15 ['特にない', '簡舗を含まない']
 18 ['よみがな', '名称かな', 'かな', 'か']
 19 ['はくさい']
 20 ['しろあり']
 22 ['特減', '特', '特塞']
 23 ['多', '強及', '広']
 24 ['第一審', '第三次産業', '転', '第三種']
 30 ['する施用機関', 'しひきたしょうがっこう']
 37 ['小計', '収入役']
 38 ['る世帯']
 39 ['う']
 40 ['主催', '応援']
 43 ['活動日', '活動場所', '展示活動名', '普及活動名']
 44 ['転送元', '設置元', '公表元']
 46 ['動機付け支援']
 52 ['附', '附ト書き']
 53 ['年齢不詳', '不明', '不詳', '住所不明']
 56 ['詳細場所', '明細地図', '地図', '詳細地区']
 57 ['年別']
 58 ['期別', '時代', '時期', '期', '時代・時期']
 60 ['法人化している', '検討している活動', '利用している', '入っている', '設置されている']
 61 ['前年保留', '終了しました', '再', '試験した']
 63 ['役目']
 64 ['シーズン', 'バイク走者', 'ラン走者', 'プレーパーク名', 'プレーパーク']
 66 ['ブロッコリ', '㈲ダイイチトレード']
 67 ['ワンポイント', 'モッとスポット備考', 'ホッとスポット備考', 'グッとスポット備考']
 68 ['対応', '対応中', 'API対応有無', '変化', '進出機能']
 71 ['無回答', '不明・回答なし']
 74 ['ページアクセス総計', '全部公開', '稼働世帯']
 77 ['竣工', '全焼']
 85 ['非営利サ', '公共系']
 97 ['函館アリーナ前', '函館どつく前', '三宮・花時計前']
 99 ['困りごと・心配ごと']
 108 ['周産期死亡', '出没頭数', '捕獲有', '目撃有', '足跡有']
 110 ['残留農薬']
 111 ['ねらい', 'ダム目的', '目標', '目標方向', '目的']
 115 ['部性別', '部', '中学部', '方部', '筋']
 130 ['昭和村役場', '明治', '大正', '昭和']
 131 ['新現元別', '下真島', '新町名', '新BOP名', '新在家']
 132 ['目名称', '丁目', '目']
 135 ['受賞者', '市長賞受賞商品', '市長賞受賞者', '市長賞受賞者連絡先']
 140 ['使用保育園', '見学', '入所']
 149 ['交流']
 150 ['よりみちクルーズ']



トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS