Це стара версія документу!
Для экономии места большие текстовые файлы с данными можно упаковывать в архив, а затем из программы на Питоне считывать нужные файлы прямо из архива. Например, если имеется папка data_files
, в которой файлы data1.txt
, data2.csv
, data3.dat
, … то её можно запаковать в ZIP-архив
zip data_files.zip data_files
после чего открывать файлы данных следующим образом1):
data_zipfile = zipfile.ZipFile('stations_data.zip','r') data_file = data_zipfile.open('stations_data/data1.txt')
Далее можно производить считывание, как из обычного файла методами read()
, readline()
или readlines()
.
Аналогично можно создать tar.gz
или tar.bz2
архивы2):
data_tar = tarfile.open("stations_data.tar.gz") data_file = data_tar.extractfile(stations_data/data2.csv)
или
data_tar = tarfile.open("stations_data.tar.bz2") data_file = data_tar.extractfile(stations_data/data3.dat)
Следует обратить внимание, что при обращении к файлу внутри архива нужно указывать полный путь к файлу внутри архива, ведь в архиве могут храниться каталоги с файлами или вложенными каталогами, и файл может располагаться в каком-либо из них.