V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
zxq2233
V2EX  ›  问与答

40M 的超大 txt, 10 亿+字符,怎么打开?

  •  
  •   zxq2233 · 2019-03-17 13:01:07 +08:00 · 14871 次点击
    这是一个创建于 2086 天前的主题,其中的信息可能已经有所发展或是发生改变。
    同事把她给我的语音转换成了 base64,存储在在一个 txt 中,我想解码这段语音

    我尝试过用 windows 的记事本打开它的话,电脑会卡死,用 EditPlus 打开僵死一阵子之后就崩溃了,用 NotePad++打开就是提示文件太大不能打开,Eclipse 更不行。以前曾据说 UltraEdit 行,试了下却不行。
    有没有办法打开啊
    第 1 条附言  ·  2019-03-17 14:10:37 +08:00
    此帖终结
    谷歌找到了解码工具
    https://sourceforge.net/projects/base64-binary/
    99 条回复    2024-05-06 22:56:58 +08:00
    edgnoz
        1
    edgnoz  
       2019-03-17 13:05:49 +08:00
    Large Text File Viewer
    试试这个?
    Judoon
        2
    Judoon  
       2019-03-17 13:07:11 +08:00 via Android
    vim
    alvin666
        3
    alvin666  
       2019-03-17 13:07:18 +08:00 via Android   ❤️ 2
    你用记事本 notepad++能解码??
    用解码工具啊

    “我有个 5g 大小的视频不能用记事本打开怎么办?”
    用视频软件打开啊
    Ansen
        4
    Ansen  
       2019-03-17 13:08:48 +08:00 via iPhone
    好久 40M 也算大了……经常打开 4g 的 log 文件
    win10 上 gvim/sublime/vscode 都没问题,排名分先后
    webdisk
        5
    webdisk  
       2019-03-17 13:08:59 +08:00   ❤️ 12
    40M 就算超大了么?
    解码的话不用打开啊, 直接 base64 -d 40M.txt > x.mp3 就行了
    alex321
        6
    alex321  
       2019-03-17 13:09:03 +08:00
    试过用 VSCode 打开过几百兆的 txt。po 主可以试试。
    blless
        7
    blless  
       2019-03-17 13:09:15 +08:00 via Android
    base64 好处理啊 按 4 的倍数读字节就好了啊
    zxq2233
        8
    zxq2233  
    OP
       2019-03-17 13:09:18 +08:00
    @alvin666 我需要把 base64 文本提取出来 decode
    Athrob
        9
    Athrob  
       2019-03-17 13:10:14 +08:00 via iPhone   ❤️ 2
    emeditor
    MoHen9
        10
    MoHen9  
       2019-03-17 13:12:49 +08:00 via Android
    Windows 的话 sublime,上 G 也没问题,Linux 可以用 vim
    PureWhiteWu
        11
    PureWhiteWu  
       2019-03-17 13:13:57 +08:00
    @zxq2233 直接写个代码读取并解码不好么……
    RyuZheng
        12
    RyuZheng  
       2019-03-17 13:15:07 +08:00 via iPhone
    写个 Python 呀,花一点点时间搜索和学一下。
    ruiowe
        13
    ruiowe  
       2019-03-17 13:15:55 +08:00
    40T 才勉强算得上超大
    kzfile
        14
    kzfile  
       2019-03-17 13:19:19 +08:00
    你同事到底想干嘛,不直说
    lzvezr
        15
    lzvezr  
       2019-03-17 13:20:51 +08:00 via iPhone
    楼主是要打开以后 Ctrl+A,Ctrl+C,Ctrl+V 复制到在线解码网站上?
    pkokp8
        16
    pkokp8  
       2019-03-17 13:23:10 +08:00 via Android
    打不开就切割成两个
    KgM4gLtF0shViDH3
        17
    KgM4gLtF0shViDH3  
       2019-03-17 13:24:42 +08:00 via iPhone
    ( ;´Д`)撩妹都要会这个技能吗
    iyuli
        18
    iyuli  
       2019-03-17 13:31:43 +08:00   ❤️ 1
    UltraEdit,内存要够大
    ljspython
        19
    ljspython  
       2019-03-17 13:35:20 +08:00   ❤️ 1
    不用解了,一般这种情况都可以直接上...不好意思粗俗了...直接表白了
    AlisaDestiny
        20
    AlisaDestiny  
       2019-03-17 13:36:55 +08:00
    你怕是用了个假的 nodepad++.
    https://notepad-plus-plus.org/community/topic/12869/what-is-the-max-file-size-for-v7x64/2

    根据上面的帖子和他们贴出的源码,notepad++的上限是 2G。
    MiaRunis
        21
    MiaRunis  
       2019-03-17 13:38:25 +08:00
    40M 太简单了 notepad++解决。
    不行的话换
    PilotEdit Lite
    nanaw
        22
    nanaw  
       2019-03-17 13:39:48 +08:00 via Android
    vscode 应该可以。首次打开会提示文件过大是否以大内存模式重启
    wukongkong
        23
    wukongkong  
       2019-03-17 13:40:09 +08:00 via Android
    @kzfile 感觉 love you .没那么大……
    murmur
        24
    murmur  
       2019-03-17 13:43:23 +08:00
    40m 怎么也算不上大。。
    ThirdFlame
        25
    ThirdFlame  
       2019-03-17 13:45:59 +08:00
    log view pro
    AwayEM
        26
    AwayEM  
       2019-03-17 13:46:49 +08:00 via iPhone
    vim emacs vscode 应该都可以
    nimrc
        27
    nimrc  
       2019-03-17 13:47:02 +08:00 via iPhone
    40m 一点都不大 算小文件
    ll3027
        28
    ll3027  
       2019-03-17 13:50:56 +08:00
    nodepad++
    geekdada
        29
    geekdada  
       2019-03-17 13:58:07 +08:00
    是你会裸眼解码还是怎么着吗,为什么要打开他
    isnowify
        30
    isnowify  
       2019-03-17 13:59:14 +08:00 via iPad
    sublime 无压力啊
    zxq2233
        31
    zxq2233  
    OP
       2019-03-17 14:02:19 +08:00
    @geekdada 是一个 json 文件。我需要读取某个 key 的值,必须删掉格式
    mikeguan
        32
    mikeguan  
       2019-03-17 14:02:21 +08:00 via Android
    不明白为什么需要打开啊,直接解码不就可以了。
    PS:40M 文件真的不大,几百 G 的文本都见过
    longline
        33
    longline  
       2019-03-17 14:03:42 +08:00 via Android
    几百兆 VScode 没问题
    swsh007
        34
    swsh007  
       2019-03-17 14:25:25 +08:00 via Android
    ultraedit
    第一次测试的时候可以打开 30m 的 log 文件
    那是 1997 年
    goodboy886
        35
    goodboy886  
       2019-03-17 14:28:33 +08:00 via iPhone
    notepad++无压力啊
    wtks1
        36
    wtks1  
       2019-03-17 14:34:16 +08:00 via Android
    win 上 ue 经常打开过 g 的文件没问题啊
    yksoft1ex
        37
    yksoft1ex  
       2019-03-17 15:04:56 +08:00
    40M 而已,记得当年网易泄露的那个,好多个几个 G 大的 SQL 文件。大站的数据库导出来,几十上百个 G 小菜一碟吧。。
    不过如果仅仅是解码 base64,不用打开吧,可以直接流式解码
    Quaintjade
        38
    Quaintjade  
       2019-03-17 15:05:12 +08:00
    为啥 10 亿+字符的 txt 只有 40MB ?还是说压缩之后 40MB ?
    Quaintjade
        39
    Quaintjade  
       2019-03-17 15:06:09 +08:00   ❤️ 1
    顺便高亮一下第一句话的“她”字
    peteryzy
        40
    peteryzy  
       2019-03-17 15:12:44 +08:00 via Android
    py 写个就行
    opengps
        41
    opengps  
       2019-03-17 15:14:07 +08:00
    写个程序,逐行读取
    moln
        42
    moln  
       2019-03-17 15:25:50 +08:00   ❤️ 1
    就我一个人关心女同事说了啥?
    Greatshu
        43
    Greatshu  
       2019-03-17 15:31:44 +08:00
    40M 真的不大,$$Tap 有一次在程序目录下生成了一个 50 多 GB 的.log 文件,我用的是 glogg
    https://glogg.bonnefon.org/description.html
    alakey1989
        44
    alakey1989  
       2019-03-17 15:33:49 +08:00
    @Quaintjade 你坐下
    Ediacaran
        45
    Ediacaran  
       2019-03-17 15:48:24 +08:00 via iPhone   ❤️ 1
    40m,读了本小说吗?
    freefcw
        46
    freefcw  
       2019-03-17 16:15:17 +08:00
    问题不是大,应该是一行太长了
    binux
        47
    binux  
       2019-03-17 16:32:46 +08:00 via Android
    @zxq2233 那就 jq 啊
    ladypxy
        48
    ladypxy  
       2019-03-17 16:35:55 +08:00 via iPhone
    Emeditor,专业打开大文件
    notreami
        49
    notreami  
       2019-03-17 16:52:25 +08:00
    才 40M。。楼主下次要问 40GB,这才有意思。
    styang
        50
    styang  
       2019-03-17 17:08:45 +08:00
    sublime text
    mmdsun
        51
    mmdsun  
       2019-03-17 17:11:07 +08:00 via Android
    tail -f - n
    alect
        52
    alect  
       2019-03-17 17:48:10 +08:00
    我很好奇她给你说的什么东西还要转码成 txt,码农的乐趣吗?
    killerv
        53
    killerv  
       2019-03-17 18:22:07 +08:00
    我还以为多大……
    zhujinliang
        54
    zhujinliang  
       2019-03-17 18:33:11 +08:00 via iPhone
    @Ansen 排名分先后好评
    ETiV
        55
    ETiV  
       2019-03-17 18:37:15 +08:00
    等等,40MB 的 base64 编码,不就应该是 400 万 个字符而已吗。怎么 1 亿+的
    valorachen
        56
    valorachen  
       2019-03-17 18:52:38 +08:00 via Android
    解码这段语音跟打开这个文件有啥关系?打开了能看到懂直接人工转码?写个代码直接转换才是解决方法吧
    zhtttyecho
        57
    zhtttyecho  
       2019-03-17 19:01:45 +08:00
    异性的各种看不懂的暗示都按表白算
    skadi
        58
    skadi  
       2019-03-17 19:17:44 +08:00
    她? 表白?
    UN2758
        59
    UN2758  
       2019-03-17 19:26:40 +08:00
    @AlisaDestiny #20 但是实际上 300mb 左右的文档就会打不开了
    hundan
        60
    hundan  
       2019-03-17 19:28:12 +08:00 via Android   ❤️ 1
    异性乱码皆表白?
    wlh233
        61
    wlh233  
       2019-03-17 19:43:39 +08:00   ❤️ 1
    知道是 base64 了还打开干嘛 ?
    base64 -d voice.txt | ffplay -i pipe:0
    yidinghe
        62
    yidinghe  
       2019-03-17 19:44:57 +08:00 via Android
    everedit
    jianghu52
        63
    jianghu52  
       2019-03-17 20:14:34 +08:00
    我用 emediter 打开过 4g 的 sql。他可以分段显示。但是对于这种解码的,不知道行不行
    immutable
        64
    immutable  
       2019-03-17 20:39:49 +08:00 via Android
    vim
    sampeng
        65
    sampeng  
       2019-03-17 21:18:53 +08:00 via iPhone
    base64 -d xxx.txt > xxx.mp4 很难么…
    churchmice
        66
    churchmice  
       2019-03-17 21:31:17 +08:00
    linux 下我用 vim 开过 1G 的日志文件无压力
    aristotll
        67
    aristotll  
       2019-03-17 21:45:34 +08:00
    vim
    miaotaizi
        68
    miaotaizi  
       2019-03-17 21:49:55 +08:00 via iPhone
    活该你单身
    EscYezi
        69
    EscYezi  
       2019-03-17 22:30:58 +08:00 via iPhone
    虽然 40MB 不大,但是 base64 编码后的字符串只有一行,文本编辑器打开确实会崩
    Shynoob
        70
    Shynoob  
       2019-03-17 22:40:14 +08:00
    你打开又不能解码。。当然是找解码工具啊
    Azure42
        71
    Azure42  
       2019-03-17 22:51:40 +08:00
    EmEditor,对大文件有优化,分块加载,经常用它看几百兆的 log
    yghack
        72
    yghack  
       2019-03-17 22:54:31 +08:00
    vim 10G 无压力
    13160919135
        73
    13160919135  
       2019-03-17 23:00:49 +08:00
    写个方法,用 nodejs 读取
    Yien
        74
    Yien  
       2019-03-17 23:47:33 +08:00 via iPhone   ❤️ 3
    没人好奇她说的什么?
    id7368
        75
    id7368  
       2019-03-18 03:53:48 +08:00
    比较奇怪 40M,Editplus 怎么会卡的,我是 Editplus N 年老用户了,以前下载的各种文本型数据库都是用这个打开的,几个 G 的文件基本几十秒就可以加载出来了,但是内存消耗的确实比较大
    sm0king
        76
    sm0king  
       2019-03-18 08:40:45 +08:00
    没人好奇她说的什么?
    shyrock
        77
    shyrock  
       2019-03-18 08:41:04 +08:00
    po 主的 notepad++必须是假的,我日常用来打开的日志文件都是 80M+啊
    billwang
        78
    billwang  
       2019-03-18 08:54:27 +08:00
    40M ?哈哈,真的不算大,几个 G 的文本文件在服务器上真的很常见。
    thfurior
        79
    thfurior  
       2019-03-18 09:04:29 +08:00 via Android
    vscode,打开过 1g 的 sql
    winiex
        80
    winiex  
       2019-03-18 09:10:40 +08:00
    这里出现打不开的问题应该不是 40M 大小的问题,很可能是这 40M 文本只有一行,这样导致编辑器的渲染算法不太好高效率地处理它。

    如果 40M 文本包含许多行文本,那基本上常见的 Text Editor 都是可以轻松加载的。
    log4geek
        81
    log4geek  
       2019-03-18 09:32:41 +08:00
    可能楼主是 1G 内存的电脑。。
    a4854857
        82
    a4854857  
       2019-03-18 09:32:46 +08:00
    我用记事本都打开过 500m 的 txt..当时是一个字符动画来着
    EdwardL
        83
    EdwardL  
       2019-03-18 09:33:27 +08:00
    干嘛要打开?直接写个两行 py 解不就好了吗。。。。
    ymj123
        84
    ymj123  
       2019-03-18 09:34:43 +08:00 via Android
    40M 的 TXT 不大,至于你这个卡死,估计是电脑太垃圾?
    a226679594
        85
    a226679594  
       2019-03-18 09:44:47 +08:00
    上个 i9
    la9998372
        86
    la9998372  
       2019-03-18 09:44:50 +08:00
    有点意思。
    huiyadanli
        87
    huiyadanli  
       2019-03-18 09:53:15 +08:00
    Emeditor 20G 的文本都能打开。。。
    wqzjk393
        88
    wqzjk393  
       2019-03-18 09:54:51 +08:00
    纯文本处理 win7 下直接 gvim 就可以了。需要更具体的处理可以 pandas 或者开个 access。
    zhila
        89
    zhila  
       2019-03-18 09:58:43 +08:00
    才 40m,大吗
    taobibi
        90
    taobibi  
       2019-03-18 10:02:50 +08:00
    notepad++了解一下
    jkjoke
        91
    jkjoke  
       2019-03-18 10:07:43 +08:00
    所以到底说了什么
    crayygy
        92
    crayygy  
       2019-03-18 10:20:55 +08:00
    曾经做论文的时候一个数据文件 10G 的我愣头愣脑的用 sublime 打开了,居然还真的能打开...
    paouke
        93
    paouke  
       2019-03-18 10:26:47 +08:00
    经常用 nodepad++打开 100 多 M 日志啊,你是文本都在一行,估计就炸了
    liuxey
        94
    liuxey  
       2019-03-18 10:27:41 +08:00
    这是女程序员新的考验方式吗?
    Orciorc
        95
    Orciorc  
       2019-03-18 10:47:41 +08:00 via Android
    akelpad
    XxxxD
        96
    XxxxD  
       2019-03-18 10:49:03 +08:00
    @crayygy 300MB 的 json 文件用 sublime 打开,等待约 30s, 无法想象你的电脑配置
    dyxLike
        97
    dyxLike  
       2019-03-18 11:32:53 +08:00
    所以说到底为啥打不开? 单行过长吗?
    SekiBetu
        98
    SekiBetu  
       2020-11-24 01:56:02 +08:00
    2020 年回来看看,现在这个问题有一个软件解决了,叫 emeditor,200G 的也能打开
    MatthewHan
        99
    MatthewHan  
       208 天前
    @Greatshu 好用,在 十几 G 的情况下,比 Emeditor 打开和检索速度差一点,但是够轻量,比 Emeditor 舒服点。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2659 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 09:56 · PVG 17:56 · LAX 01:56 · JFK 04:56
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.