import pandas as pd import shutil import os FNAME="items_name_all_vec_150_191212.csv" print(" CSV of item data reading...") df=pd.read_csv(FNAME,sep=",",encoding="utf-8-sig",header =None) #項目データ 項目名ペアを読み込み print(df) len_df=len(df) dict ={} #回数を統計 dict ={} for m in range(df.shape[0]):#行数クラスタリングの分布 name = df.iat[m,0]#項目名 label=df.iat[m,51]#クラスタのラベル if label in dict.keys(): dict[label].append(name) else: dict[label]=[name] print(dict) print(len(dict)) extract_dict ={} for i in range(1,151): if len(dict[i]) <= 5: #print(i,dict[i]) for item in dict[i]: print(item) extract_dict[item]=i fname="pre2_csv_items_all_20200220.csv" df=pd.read_csv(fname,sep=",",header=0) #項目データ 項目名ペアを読み込み list_tmp=[] for i in range(len(df)): if df.iat[i,1] in extract_dict.keys():#全データ(dataset)の分布 f_name = df.iat[i,2] if (f_name not in list_tmp and os.path.exists(f_name)): print(f_name) list_tmp.append(f_name) # 第二引数がディレクトリの場合、同じファイル名でコピーされます shutil.copy(df.iat[i,2], './tmp')