seminar-personal/chin2017

少ないクラスタに入っているオープンデータはどんなデータか?
項目データの数ではなく、項目名の少ないクラスタを調査する。

上記の調査 前回のゼミ

  • 項目名の少ないクラスタ(1個項目名のみ)
    北中	4
    当落	7
    で医療対	13
    はくさい	19
    しろあり	20
    る世帯	38
    う	39
    動機付け支援	46
    年別	57
    役目	63
    困りごと・心配ごと	99
    残留農薬	110
    • ソースコードで抽出
    • fileitems_name_all_vec_150_191212.csv
      import pandas as pd
      FNAME="items_name_all_vec_150_191212.csv"
      print(" CSV of item data reading...")
      df=pd.read_csv(FNAME,sep=",",encoding="utf-8-sig",header =None) #項目データ 項目名ペアを読み込み
      print(df)
      len_df=len(df)
      dict ={}
      #回数を統計
      dict ={}
      for m in range(df.shape[0]):#行数クラスタリングの分布
          name = df.iat[m,0]#項目名
          label=df.iat[m,51]#クラスタのラベル
          if label in dict.keys():
              dict[label].append(name)
          else:
              dict[label]=[name]
      print(dict)
      print(len(dict))
      for i in range(1,151):
          if len(dict[i]) <= 5:
              print(i,dict[i])
  • 結果(5個項目名以下のクラスタ) クラスタ 項目名
    1 ['せ', 'せ用']
    4 ['北中']
    5 ['なす', '見出し']
    6 ['歳入出', '県内の出']
    7 ['当落']
    9 ['仕事に', '仕事', '単身', 'ひとり暮らし', 'ずっと住み続けたい']
    10 ['離別', '離婚', '婚姻']
    12 ['統計で見るつづき', '新鮮でおいしければ']
    13 ['で医療対']
    14 ['障がい程度', 'いる', '障がい名']
    15 ['特にない', '簡舗を含まない']
    18 ['よみがな', '名称かな', 'かな', 'か']
    19 ['はくさい']
    20 ['しろあり']
    22 ['特減', '特', '特塞']
    23 ['多', '強及', '広']
    24 ['第一審', '第三次産業', '転', '第三種']
    30 ['する施用機関', 'しひきたしょうがっこう']
    37 ['小計', '収入役']
    38 ['る世帯']
    39 ['う']
    40 ['主催', '応援']
    43 ['活動日', '活動場所', '展示活動名', '普及活動名']
    44 ['転送元', '設置元', '公表元']
    46 ['動機付け支援']
    52 ['附', '附ト書き']
    53 ['年齢不詳', '不明', '不詳', '住所不明']
    56 ['詳細場所', '明細地図', '地図', '詳細地区']
    57 ['年別']
    58 ['期別', '時代', '時期', '期', '時代・時期']
    60 ['法人化している', '検討している活動', '利用している', '入っている', '設置されている']
    61 ['前年保留', '終了しました', '再', '試験した']
    63 ['役目']
    64 ['シーズン', 'バイク走者', 'ラン走者', 'プレーパーク名', 'プレーパーク']
    66 ['ブロッコリ', '㈲ダイイチトレード']
    67 ['ワンポイント', 'モッとスポット備考', 'ホッとスポット備考', 'グッとスポット備考']
    68 ['対応', '対応中', 'API対応有無', '変化', '進出機能']
    71 ['無回答', '不明・回答なし']
    74 ['ページアクセス総計', '全部公開', '稼働世帯']
    77 ['竣工', '全焼']
    85 ['非営利サ', '公共系']
    97 ['函館アリーナ前', '函館どつく前', '三宮・花時計前']
    99 ['困りごと・心配ごと']
    108 ['周産期死亡', '出没頭数', '捕獲有', '目撃有', '足跡有']
    110 ['残留農薬']
    111 ['ねらい', 'ダム目的', '目標', '目標方向', '目的']
    115 ['部性別', '部', '中学部', '方部', '筋']
    130 ['昭和村役場', '明治', '大正', '昭和']
    131 ['新現元別', '下真島', '新町名', '新BOP名', '新在家']
    132 ['目名称', '丁目', '目']
    135 ['受賞者', '市長賞受賞商品', '市長賞受賞者', '市長賞受賞者連絡先']
    140 ['使用保育園', '見学', '入所']
    149 ['交流']
    150 ['よりみちクルーズ']

添付ファイル: fileitems_name_all_vec_150_191212.csv 289件 [詳細]

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2020-02-14 (金) 16:04:27