V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
1140601003
V2EX  ›  OpenAI

话说 gtp4 能不能分析整个项目结构,解释整个项目的

  •  1
     
  •   1140601003 · 2023-11-10 14:02:32 +08:00 · 5237 次点击
    这是一个创建于 384 天前的主题,其中的信息可能已经有所发展或是发生改变。
    有大佬懂的吗??陷入了僵局
    37 条回复    2023-11-16 21:22:06 +08:00
    1140601003
        1
    1140601003  
    OP
       2023-11-10 14:06:04 +08:00
    或者说目前有没有其他的 ai 能够实现这样的功能呢
    asaxing
        2
    asaxing  
       2023-11-10 14:06:34 +08:00
    我正在研究这个
    1140601003
        3
    1140601003  
    OP
       2023-11-10 14:14:27 +08:00
    @asaxing 佬,打算自己写一个吗? qaq
    JiangkaaiShenng
        4
    JiangkaaiShenng  
       2023-11-10 14:15:22 +08:00
    不能一下输入这么多 token,字太多会胡言乱语(困惑)
    lcy630409
        5
    lcy630409  
       2023-11-10 14:18:11 +08:00   ❤️ 2
    哥 别这样想
    目前我们还能 crud ,,这样下去 我们程序员要失业了
    1140601003
        6
    1140601003  
    OP
       2023-11-10 14:18:50 +08:00
    @JiangkaaiShenng 最近好像更新了,不知道行不行
    x86
        7
    x86  
       2023-11-10 14:19:19 +08:00
    用知识库去分析
    1140601003
        8
    1140601003  
    OP
       2023-11-10 14:20:16 +08:00
    @lcy630409 唉,没办法,阅读别人的项目源码的时候,不辅助阅读的话,真的很难受
    phas3
        9
    phas3  
       2023-11-10 14:21:41 +08:00
    你说的这个是自建知识库吧,原理是把信息存到向量数据库里,然后让 GPT 生成回答的时候去数据库里搜索相关的信息,目前已经有不少实现了,github 里有,但是效果可能暂时还达不到你需要的程度。
    chendy
        10
    chendy  
       2023-11-10 14:22:49 +08:00   ❤️ 1
    啥时候微软用这玩意分析 windows 源码再说吧…
    JiangkaaiShenng
        11
    JiangkaaiShenng  
       2023-11-10 14:23:00 +08:00
    显卡显存就这么多,目前的大模型只能记住中英文几万字左右
    asaxing
        12
    asaxing  
       2023-11-10 14:23:56 +08:00
    @1140601003 还在探索,效果不错的话考虑做个单独的工具
    1140601003
        13
    1140601003  
    OP
       2023-11-10 14:26:35 +08:00
    @seuilping 这个我就不清楚了😂😂😂。
    1140601003
        14
    1140601003  
    OP
       2023-11-10 14:26:49 +08:00
    @chendy 😂😂😂😂😂
    ZGame
        15
    ZGame  
       2023-11-10 14:34:38 +08:00
    限制 gpt4 的只有上下文的长度...分析整个项目当然不在话下。关键是要怎么喂给他 怎么输出回来
    justFxxk2060
        16
    justFxxk2060  
       2023-11-10 14:39:26 +08:00
    太长,分段输入,前面的就会记不住,瞎说。
    FreshOldMan
        17
    FreshOldMan  
       2023-11-10 14:49:12 +08:00
    不行吧,现在最大 token 是 120k
    edw1n
        18
    edw1n  
       2023-11-10 15:02:20 +08:00   ❤️ 1
    用 GPT 学术优化 https://github.com/binary-husky/gpt_academic ,其中有个程序剖析的功能。
    huaxxy94
        19
    huaxxy94  
       2023-11-10 15:07:54 +08:00
    楼上推荐的那些文档分析,反正用过都不太尽人意,这方面还是要有一段路走的
    TAFMT
        20
    TAFMT  
       2023-11-10 15:09:18 +08:00
    等这个实现了,crud 将实现非常快。程序员就变成 ai 程序员了
    EyebrowsWhite
        21
    EyebrowsWhite  
       2023-11-10 15:09:18 +08:00 via iPhone
    copilot chat 一定程度上可以辅助
    xuelang
        22
    xuelang  
       2023-11-10 15:12:07 +08:00
    中大型项目,比如 redis 源码这些,ChatGPT 要是能分析,那就真的是 AGI 了。

    短时间内,感觉还是不现实;不过可以拆分来慢慢让 AI 分析
    billzhuang
        23
    billzhuang  
       2023-11-10 15:21:47 +08:00
    GPTs 可以么?把源代码扔进去
    AeroXi
        24
    AeroXi  
       2023-11-10 15:35:46 +08:00
    你需要 copilot chat 新功能,@workspace 可以对整个项目提问,不过没试过能不能解释整个项目
    有个开源项目可以解释整个项目
    https://github.com/binary-husky/gpt_academic/blob/master/crazy_functions/解析项目源代码.py
    wangcongming
        25
    wangcongming  
       2023-11-10 15:36:39 +08:00
    啥时候从 128k 变成 1 个 g ,就完全可以了
    winglight2016
        26
    winglight2016  
       2023-11-10 15:56:20 +08:00   ❤️ 1
    我试过 excel 的处理,非常不智能,一个劲的问我要 sample ,老是无法处理。另外,又试了一下 data analysist ,号称自动化数据分析,等我传上去一个很简单的时序数据集,又问我想怎么分析,我要知道怎么分析,还问你干啥?

    分析代码库,任重道远,目前的 AI 距离这目标还早。
    lihua123
        27
    lihua123  
       2023-11-10 16:33:09 +08:00
    @winglight2016 #26 ai 的水平取决于使用的人的水平
    Sucorde
        28
    Sucorde  
       2023-11-10 16:36:40 +08:00
    这个最少还要等一年,毕竟对于大型的代码来讲,它,记,不,住。
    weaaew
        29
    weaaew  
       2023-11-10 16:45:34 +08:00
    新的模型 token 是 128K 好像,不过可能输进去项目报表或者图片什么的分析一下?
    yinlin1244
        30
    yinlin1244  
       2023-11-10 16:50:01 +08:00
    https://github.com/BloopAI/bloop 可以检索整个代码库
    HangoX
        31
    HangoX  
       2023-11-10 16:55:11 +08:00
    autogpt 是可以的,分析整个项目不用一次性读取
    LPJD
        32
    LPJD  
       2023-11-10 16:58:52 +08:00
    目前不能,算力不足。还经常胡说八道。10 年后估计吧
    1140601003
        33
    1140601003  
    OP
       2023-11-10 17:59:34 +08:00
    @Sucorde 嗯嗯。那我还是慢慢分析源码吧
    1140601003
        34
    1140601003  
    OP
       2023-11-10 18:00:01 +08:00
    @EyebrowsWhite 是的,不过只是单片段
    skmO
        35
    skmO  
       2023-11-11 15:22:06 +08:00
    刚好看到一个 https://app.getonboardai.com/ 不知道有没有用
    JokinChung
        36
    JokinChung  
       2023-11-11 23:38:02 +08:00
    前两天也在想 chatgpt 能不能帮忙做类似的两件事:
    1. 接手新项目时,帮忙理解代码
    2. 接手新需求时,在理解项目的基础下,帮忙写代码
    让它自己回答能不能干这两件事,回答是“一次性分析整个工程可能会导致输出信息过于庞大和复杂,难以处理”,建议“粘贴项目中的一些关键代码或文件,我将尽力为你提供有关项目的信息和建议。”
    1140601003
        37
    1140601003  
    OP
       2023-11-16 21:22:06 +08:00
    @skmO 好咧!谢谢大哥,我去尝试着一下
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1062 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 20:06 · PVG 04:06 · LAX 12:06 · JFK 15:06
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.