인공지능 챗봇 데이터셋을 만드는 과정에서 csv파일로 저장해야하는 일이 생겼다.
까먹을지도 모르니 나를 위해 기록한다.
먼저 텍스트 파일 속 내용은 이러하다.
f = open('total_train_data_2.csv', "w", encoding = 'UTF8')
f.write("query,intent\n") # 헤더 추가
일종의 국룰로써 최상단에 열들의 특징을 표현할 헤더를 추가해준다.
def read_corpus_data(filename):
with open(filename, 'r', encoding='UTF8') as f:
data = [line.split('\t') for line in f.read().splitlines()] # ['문장', '' , '1']
print(data[0])
return data
UTF8로 인코딩시켜서 불러온 뒤 줄단위로 잘라온다.
corpus_data = read_corpus_data('train_tools/dict/corpus2.txt')
for k in range(len(corpus_data)):
f.write(corpus_data[k][1] + ',' + corpus_data[k][3] + '\n') # 문장과 의도 번호만 저장
f.close()
문장,0 << 문장과 의도 번호만 나오도록 뽑아내서 저장시키면 끝이다.
[Python] 사진의 밝기에 따라 불투명도 조절, 휘도를 투명도로 변환하기 (0) | 2023.02.01 |
---|---|
[Jupyter Notebook] 다크모드로 변경하는 법 (0) | 2023.01.31 |
댓글 영역