#author("2020-02-14T05:49:04+00:00","default:f-lab","f-lab") #author("2020-02-14T07:03:25+00:00","default:f-lab","f-lab") [[seminar-personal/chin2017]] 少ないクラスタに入っているオープンデータはどんなデータか? 項目データの数ではなく、項目名の少ないクラスタを調査する。 上記の調査 [[前回のゼミ>http://f-lab.mydns.jp/index.php?chin2017-20191221]] -項目名の少ないクラスタ(1個項目名のみ) 北中 4 当落 7 で医療対 13 はくさい 19 しろあり 20 る世帯 38 う 39 動機付け支援 46 年別 57 役目 63 困りごと・心配ごと 99 残留農薬 110 --ソースコードで抽出 --&ref(chin2017-20200214/items_name_all_vec_150_191212.csv); import pandas as pd FNAME="items_name_all_vec_150_191212.csv" print(" CSV of item data reading...") df=pd.read_csv(FNAME,sep=",",encoding="utf-8-sig",header =None) #項目データ 項目名ペアを読み込み print(df) len_df=len(df) dict ={} #回数を統計 dict ={} for m in range(df.shape[0]):#行数クラスタリングの分布 name = df.iat[m,0]#項目名 label=df.iat[m,51]#クラスタのラベル if label in dict.keys(): dict[label].append(name) else: dict[label]=[name] print(dict) print(len(dict)) for i in range(1,151): if len(dict[i]) <= 5: print(i,dict[i]) -結果(5個項目名以下のクラスタ) クラスタ 項目名 1 ['せ', 'せ用'] 4 ['北中'] 5 ['なす', '見出し'] 6 ['歳入出', '県内の出'] 7 ['当落'] 9 ['仕事に', '仕事', '単身', 'ひとり暮らし', 'ずっと住み続けたい'] 10 ['離別', '離婚', '婚姻'] 12 ['統計で見るつづき', '新鮮でおいしければ'] 13 ['で医療対'] 14 ['障がい程度', 'いる', '障がい名'] 15 ['特にない', '簡舗を含まない'] 18 ['よみがな', '名称かな', 'かな', 'か'] 19 ['はくさい'] 20 ['しろあり'] 22 ['特減', '特', '特塞'] 23 ['多', '強及', '広'] 24 ['第一審', '第三次産業', '転', '第三種'] 30 ['する施用機関', 'しひきたしょうがっこう'] 37 ['小計', '収入役'] 38 ['る世帯'] 39 ['う'] 40 ['主催', '応援'] 43 ['活動日', '活動場所', '展示活動名', '普及活動名'] 44 ['転送元', '設置元', '公表元'] 46 ['動機付け支援'] 52 ['附', '附ト書き'] 53 ['年齢不詳', '不明', '不詳', '住所不明'] 56 ['詳細場所', '明細地図', '地図', '詳細地区'] 57 ['年別'] 58 ['期別', '時代', '時期', '期', '時代・時期'] 60 ['法人化している', '検討している活動', '利用している', '入っている', '設置されている'] 61 ['前年保留', '終了しました', '再', '試験した'] 63 ['役目'] 64 ['シーズン', 'バイク走者', 'ラン走者', 'プレーパーク名', 'プレーパーク'] 66 ['ブロッコリ', '㈲ダイイチトレード'] 67 ['ワンポイント', 'モッとスポット備考', 'ホッとスポット備考', 'グッとスポット備考'] 68 ['対応', '対応中', 'API対応有無', '変化', '進出機能'] 71 ['無回答', '不明・回答なし'] 74 ['ページアクセス総計', '全部公開', '稼働世帯'] 77 ['竣工', '全焼'] 85 ['非営利サ', '公共系'] 97 ['函館アリーナ前', '函館どつく前', '三宮・花時計前'] 99 ['困りごと・心配ごと'] 108 ['周産期死亡', '出没頭数', '捕獲有', '目撃有', '足跡有'] 110 ['残留農薬'] 111 ['ねらい', 'ダム目的', '目標', '目標方向', '目的'] 115 ['部性別', '部', '中学部', '方部', '筋'] 130 ['昭和村役場', '明治', '大正', '昭和'] 131 ['新現元別', '下真島', '新町名', '新BOP名', '新在家'] 132 ['目名称', '丁目', '目'] 135 ['受賞者', '市長賞受賞商品', '市長賞受賞者', '市長賞受賞者連絡先'] 140 ['使用保育園', '見学', '入所'] 149 ['交流'] 150 ['よりみちクルーズ']