Python을 사용하여 텍스트 파일을 목록 또는 배열로 읽는 방법
텍스트 파일의 행을 목록이나 python 배열로 읽으려고 합니다.리스트 또는 어레이 내의 아이템을 작성한 후에 개별적으로 액세스 할 수 있으면 됩니다.
텍스트 파일의 형식은 다음과 같습니다.
0,0,200,0,53,1,0,255,...,0.
어디서?...위에 있습니다. 실제 텍스트 파일에는 수백 또는 수천 개의 항목이 더 있습니다.
다음 코드를 사용하여 파일을 목록으로 읽으려고 합니다.
text_file = open("filename.dat", "r")
lines = text_file.readlines()
print lines
print len(lines)
text_file.close()
출력은 다음과 같습니다.
['0,0,200,0,53,1,0,255,...,0.']
1
파일 전체를 개별 항목 목록이 아닌 하나의 항목 목록으로 읽는 것 같습니다.내가 뭘 잘못하고 있지?
스트링을 값 목록으로 분할해야 합니다.split()
그렇게,
lines = text_file.read().split(',')
편집: 나는 이것에 그렇게 많은 견인력이 있을 줄은 몰랐다.좀 더 관용적인 접근법이 있습니다.
import csv
with open('filename.csv', 'r') as fd:
reader = csv.reader(fd)
for row in reader:
# do something
다음과 같은 numpy loadtx를 사용할 수도 있습니다.
from numpy import loadtxt
lines = loadtxt("filename.dat", comments="#", delimiter=",", unpack=False)
그래서 목록 목록을 만들고 싶으시다면...빈 리스트부터 시작해야 합니다.
list_of_lists = []
다음으로 파일 내용을 한 줄 한 줄 읽습니다.
with open('data') as f:
for line in f:
inner_list = [elt.strip() for elt in line.split(',')]
# in alternative, if you need to use the file content as numbers
# inner_list = [int(elt.strip()) for elt in line.split(',')]
list_of_lists.append(inner_list)
일반적인 사용 사례는 컬럼 데이터이지만 스토리지 단위는 파일 행이며, 파일 행은 하나씩 읽었기 때문에 목록 전치를 원할 수 있습니다.이것은 다음과 같은 관용어로 할 수 있다.
by_cols = zip(*list_of_lists)
또 다른 일반적인 용도는 각 열에 이름을 붙이는 것입니다.
col_names = ('apples sold', 'pears sold', 'apples revenue', 'pears revenue')
by_names = {}
for i, col_name in enumerate(col_names):
by_names[col_name] = by_cols[i]
동종 데이터 항목에 대한 작업을 수행할 수 있습니다.
mean_apple_prices = [money/fruits for money, fruits in
zip(by_names['apples revenue'], by_names['apples_sold'])]
제가 작성한 대부분의 내용은csv모듈, 표준 라이브러리에서.또 다른 서드파티 모듈은pandas표준 데이터 분석의 대부분의 측면을 자동화할 수 있습니다(다만 여러 종속성이 있습니다).
Python 2에서 업데이트zip(*list_of_lists)다른 (변환된) 목록 목록을 반환합니다.Python 3에서는 상황이 변경되어zip(*list_of_lists)는 서브스크립트 할 수 없는 zip 객체를 반환합니다.
색인화된 액세스가 필요한 경우 다음을 사용할 수 있습니다.
by_cols = list(zip(*list_of_lists))
두 버전의 Python 목록을 제공합니다.
한편 색인화된 액세스가 필요하지 않고 열 이름으로 색인화된 사전을 작성하는 것만으로 충분하다면 zip 객체도 괜찮습니다.
file = open('some_data.csv')
names = get_names(next(file))
columns = zip(*((x.strip() for x in line.split(',')) for line in file)))
d = {}
for name, column in zip(names, columns): d[name] = column
이 질문은 파일에서 쉼표로 구분된 값 내용을 반복 가능한 목록으로 읽는 방법을 묻고 있습니다.
0,0,200,0,53,1,0,255,...,0.
이를 위한 가장 쉬운 방법은csv모듈:
import csv
with open('filename.dat', newline='') as csvfile:
spamreader = csv.reader(csvfile, delimiter=',')
이제 쉽게 반복할 수 있습니다.spamreader음음음같 뭇매하다
for row in spamreader:
print(', '.join(row))
자세한 예는 설명서를 참조하십시오.
조금 늦었지만 텍스트 파일을 데이터 프레임으로 읽은 다음 해당 열을 목록으로 변환할 수도 있습니다.
lista=pd.read_csv('path_to_textfile.txt', sep=",", header=None)[0].tolist()
예.
lista=pd.read_csv('data/holdout.txt',sep=',',header=None)[0].tolist()
참고: 대응하는 데이터 프레임의 열 이름은 정수 형식이며 첫 번째 열만 추출했기 때문에 0을 선택합니다.
이렇게 하는 게 좋을 거야
def txt_to_lst(file_path):
try:
stopword=open(file_path,"r")
lines = stopword.read().split('\n')
print(lines)
except Exception as e:
print(e)
언급URL : https://stackoverflow.com/questions/14676265/how-to-read-a-text-file-into-a-list-or-an-array-with-python
'programing' 카테고리의 다른 글
| 오프라인으로 패키지를 설치하는 방법 (0) | 2022.11.14 |
|---|---|
| i18n을 사용한vue 3 vite의 국제화 (0) | 2022.11.14 |
| Python 3을 사용하여 Jupyter Notebook에서 상대적인 Import가 있는 다른 디렉토리에 있는 모듈에서 로컬 함수를 Import합니다. (0) | 2022.11.14 |
| Vanilla JavaScript vs. jQuery를 사용하는 경우 (0) | 2022.11.14 |
| express req 객체를 사용하여 요청 경로를 가져오는 방법 (0) | 2022.11.13 |