chin2017-20200214
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
|
ログイン
]
開始行:
[[seminar-personal/chin2017]]
少ないクラスタに入っているオープンデータはどんなデータか?
項目データの数ではなく、項目名の少ないクラスタを調査する。
上記の調査
[[前回のゼミ>http://f-lab.mydns.jp/index.php?chin2017-201...
-項目名の少ないクラスタ(1個項目名のみ)
北中 4
当落 7
で医療対 13
はくさい 19
しろあり 20
る世帯 38
う 39
動機付け支援 46
年別 57
役目 63
困りごと・心配ごと 99
残留農薬 110
--ソースコードで抽出
--&ref(chin2017-20200214/items_name_all_vec_150_191212.cs...
import pandas as pd
FNAME="items_name_all_vec_150_191212.csv"
print(" CSV of item data reading...")
df=pd.read_csv(FNAME,sep=",",encoding="utf-8-sig",header...
print(df)
len_df=len(df)
dict ={}
#回数を統計
dict ={}
for m in range(df.shape[0]):#行数クラスタリングの分布
name = df.iat[m,0]#項目名
label=df.iat[m,51]#クラスタのラベル
if label in dict.keys():
dict[label].append(name)
else:
dict[label]=[name]
print(dict)
print(len(dict))
for i in range(1,151):
if len(dict[i]) <= 5:
print(i,dict[i])
-結果(5個項目名以下のクラスタ)
クラスタ 項目名
1 ['せ', 'せ用']
4 ['北中']
5 ['なす', '見出し']
6 ['歳入出', '県内の出']
7 ['当落']
9 ['仕事に', '仕事', '単身', 'ひとり暮らし', 'ずっと住み...
10 ['離別', '離婚', '婚姻']
12 ['統計で見るつづき', '新鮮でおいしければ']
13 ['で医療対']
14 ['障がい程度', 'いる', '障がい名']
15 ['特にない', '簡舗を含まない']
18 ['よみがな', '名称かな', 'かな', 'か']
19 ['はくさい']
20 ['しろあり']
22 ['特減', '特', '特塞']
23 ['多', '強及', '広']
24 ['第一審', '第三次産業', '転', '第三種']
30 ['する施用機関', 'しひきたしょうがっこう']
37 ['小計', '収入役']
38 ['る世帯']
39 ['う']
40 ['主催', '応援']
43 ['活動日', '活動場所', '展示活動名', '普及活動名']
44 ['転送元', '設置元', '公表元']
46 ['動機付け支援']
52 ['附', '附ト書き']
53 ['年齢不詳', '不明', '不詳', '住所不明']
56 ['詳細場所', '明細地図', '地図', '詳細地区']
57 ['年別']
58 ['期別', '時代', '時期', '期', '時代・時期']
60 ['法人化している', '検討している活動', '利用している'...
61 ['前年保留', '終了しました', '再', '試験した']
63 ['役目']
64 ['シーズン', 'バイク走者', 'ラン走者', 'プレーパーク...
66 ['ブロッコリ', '㈲ダイイチトレード']
67 ['ワンポイント', 'モッとスポット備考', 'ホッとスポッ...
68 ['対応', '対応中', 'API対応有無', '変化', '進出機...
71 ['無回答', '不明・回答なし']
74 ['ページアクセス総計', '全部公開', '稼働世帯']
77 ['竣工', '全焼']
85 ['非営利サ', '公共系']
97 ['函館アリーナ前', '函館どつく前', '三宮・花時計前']
99 ['困りごと・心配ごと']
108 ['周産期死亡', '出没頭数', '捕獲有', '目撃有', '足跡...
110 ['残留農薬']
111 ['ねらい', 'ダム目的', '目標', '目標方向', '目的']
115 ['部性別', '部', '中学部', '方部', '筋']
130 ['昭和村役場', '明治', '大正', '昭和']
131 ['新現元別', '下真島', '新町名', '新BOP名', '新在...
132 ['目名称', '丁目', '目']
135 ['受賞者', '市長賞受賞商品', '市長賞受賞者', '市長賞...
140 ['使用保育園', '見学', '入所']
149 ['交流']
150 ['よりみちクルーズ']
終了行:
[[seminar-personal/chin2017]]
少ないクラスタに入っているオープンデータはどんなデータか?
項目データの数ではなく、項目名の少ないクラスタを調査する。
上記の調査
[[前回のゼミ>http://f-lab.mydns.jp/index.php?chin2017-201...
-項目名の少ないクラスタ(1個項目名のみ)
北中 4
当落 7
で医療対 13
はくさい 19
しろあり 20
る世帯 38
う 39
動機付け支援 46
年別 57
役目 63
困りごと・心配ごと 99
残留農薬 110
--ソースコードで抽出
--&ref(chin2017-20200214/items_name_all_vec_150_191212.cs...
import pandas as pd
FNAME="items_name_all_vec_150_191212.csv"
print(" CSV of item data reading...")
df=pd.read_csv(FNAME,sep=",",encoding="utf-8-sig",header...
print(df)
len_df=len(df)
dict ={}
#回数を統計
dict ={}
for m in range(df.shape[0]):#行数クラスタリングの分布
name = df.iat[m,0]#項目名
label=df.iat[m,51]#クラスタのラベル
if label in dict.keys():
dict[label].append(name)
else:
dict[label]=[name]
print(dict)
print(len(dict))
for i in range(1,151):
if len(dict[i]) <= 5:
print(i,dict[i])
-結果(5個項目名以下のクラスタ)
クラスタ 項目名
1 ['せ', 'せ用']
4 ['北中']
5 ['なす', '見出し']
6 ['歳入出', '県内の出']
7 ['当落']
9 ['仕事に', '仕事', '単身', 'ひとり暮らし', 'ずっと住み...
10 ['離別', '離婚', '婚姻']
12 ['統計で見るつづき', '新鮮でおいしければ']
13 ['で医療対']
14 ['障がい程度', 'いる', '障がい名']
15 ['特にない', '簡舗を含まない']
18 ['よみがな', '名称かな', 'かな', 'か']
19 ['はくさい']
20 ['しろあり']
22 ['特減', '特', '特塞']
23 ['多', '強及', '広']
24 ['第一審', '第三次産業', '転', '第三種']
30 ['する施用機関', 'しひきたしょうがっこう']
37 ['小計', '収入役']
38 ['る世帯']
39 ['う']
40 ['主催', '応援']
43 ['活動日', '活動場所', '展示活動名', '普及活動名']
44 ['転送元', '設置元', '公表元']
46 ['動機付け支援']
52 ['附', '附ト書き']
53 ['年齢不詳', '不明', '不詳', '住所不明']
56 ['詳細場所', '明細地図', '地図', '詳細地区']
57 ['年別']
58 ['期別', '時代', '時期', '期', '時代・時期']
60 ['法人化している', '検討している活動', '利用している'...
61 ['前年保留', '終了しました', '再', '試験した']
63 ['役目']
64 ['シーズン', 'バイク走者', 'ラン走者', 'プレーパーク...
66 ['ブロッコリ', '㈲ダイイチトレード']
67 ['ワンポイント', 'モッとスポット備考', 'ホッとスポッ...
68 ['対応', '対応中', 'API対応有無', '変化', '進出機...
71 ['無回答', '不明・回答なし']
74 ['ページアクセス総計', '全部公開', '稼働世帯']
77 ['竣工', '全焼']
85 ['非営利サ', '公共系']
97 ['函館アリーナ前', '函館どつく前', '三宮・花時計前']
99 ['困りごと・心配ごと']
108 ['周産期死亡', '出没頭数', '捕獲有', '目撃有', '足跡...
110 ['残留農薬']
111 ['ねらい', 'ダム目的', '目標', '目標方向', '目的']
115 ['部性別', '部', '中学部', '方部', '筋']
130 ['昭和村役場', '明治', '大正', '昭和']
131 ['新現元別', '下真島', '新町名', '新BOP名', '新在...
132 ['目名称', '丁目', '目']
135 ['受賞者', '市長賞受賞商品', '市長賞受賞者', '市長賞...
140 ['使用保育園', '見学', '入所']
149 ['交流']
150 ['よりみちクルーズ']
ページ名: