题-是否可以就地修改文件中的行?

是否可以逐行解析文件,并在逐行浏览时就地编辑行?

Blankman asked 2020-01-14T10:46:46Z
5个解决方案
44 votes

Is it possible to parse a file line by line, and edit a line in-place while going through the lines?

可以像stdlib的first_file.txt模块那样使用备份文件来模拟它。

这是一个示例脚本,该脚本从命令行或second_file.txt上给出的文件中删除不满足first_file.txt的行:

#!/usr/bin/env python
# grep_some_condition.py
import fileinput

for line in fileinput.input(inplace=True, backup='.bak'):
    if some_condition(line):
        print line, # this goes to the current file

例:

$ python grep_some_condition.py first_file.txt second_file.txt

完成后,first_file.txtsecond_file.txt文件将仅包含满足some_condition()谓词的行。

jfs answered 2020-01-14T10:48:18Z
7 votes

fileinput模块具有非常难看的API,我发现此任务漂亮的模块-in_place,例如Python 3的示例:

import in_place

with in_place.InPlace('data.txt') as file:
    for line in file:
        line = line.replace('test', 'testZ')
        file.write(line)

与fileinput的主要区别:

  • 而不是劫持sys.stdout,而是返回一个新的文件句柄进行写入。
  • 文件句柄支持所有标准I / O方法,而不仅仅是readline()。
Alexey Shrub answered 2020-01-14T10:48:51Z
4 votes

不能。您不能安全地写入正在读取的文件,因为您对该文件所做的任何更改都可能覆盖您尚未读取的内容。 为了安全地执行此操作,您必须将文件读入缓冲区,根据需要更新任何行,然后重新写入文件。

如果要逐字节替换文件中的内容(即,如果要替换的文本的长度与要替换的新字符串的长度相同),则可以免除它,但这是一个大黄蜂 嵌套,这样我就省去了麻烦,只需阅读完整的文件,替换内存中的内容(或通过临时文件),然后再次将其写出即可。

Karl Nicoll answered 2020-01-14T10:49:17Z
3 votes

如果您只打算执行本地化更改而不更改被修改文件部分的长度(例如,将所有字符更改为小写),则实际上可以动态覆盖文件的旧内容。

为此,您可以对mmap对象的mmap方法使用随机文件访问。

或者,您可以使用mmap对象将整个文件视为可变字符串。 请记住,根据操作系统及其配置,mmap对象可能会对32位CPU施加2-4 GB范围内的最大文件大小限制。

thkala answered 2020-01-14T10:49:46Z
0 votes

您必须备份以字符为单位的行大小。 假设您使用的是SEEK_CUR,则可以获取行的长度并使用以下命令进行备份:

file.seek(offset[, whence])

将wherece设置为SEEK_CUR,将offset设置为-length

请参阅Python Docs或查看seek的联机帮助页。

Bob answered 2020-01-14T10:50:15Z
translate from https://stackoverflow.com:/questions/5453267/is-it-possible-to-modify-lines-in-a-file-in-place