V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
AmItheRobot
V2EX  ›  问与答

怎样获取 Google 搜索结果里的完整摘要?或类似缓存快照?

  •  
  •   AmItheRobot · 2019-02-21 15:31:53 +08:00 · 1523 次点击
    这是一个创建于 2107 天前的主题,其中的信息可能已经有所发展或是发生改变。

    我是文科生,所以表述上肯定不准确,大佬们明白意思就好哈^_^

    例如,Google 搜索这个关键词:

    https://www.google.com/search?q="和 adc 说是兄弟站其实很勉强"
    

    得到唯一的搜索结果

    但会发现,它的链接打不开了。那么假如我们就是想知道该网页的全文,该怎么办呢?

    • 尝试用 http://cachedview.com/ 打开该页面的 Google Cache 和 Archive.org ,发现这俩都没“收录”(或者说爬取,不知道专业术语)
    • 尝试在 archive.today 里找,发现也没有人预先抓过

    到这里我就没辙了。但是很显然,谷歌数据库里存储了该页面的完整摘要(因为能搜索到呀),而且可通过以下链接窥得一二:

    https://www.google.com/search?q="管理员 lurch 为人很有原则而且貌似很有钱"
    https://www.google.com/search?q="估计都捐不了.该站有专门申请邀请的板块"
    

    所以这种能用谷歌搜出来,但却打不开,几大快照服务也没收录的情况,有啥办法还能获得内容么?例如获取谷歌存的摘要?

    PS:这个帖子问的是方法(渔),不是例子(鱼),这篇帖子已经通过其它方法找到全文了…此处只是举例,谢谢

    5 条回复    2019-06-22 19:12:18 +08:00
    Windelight
        1
    Windelight  
       2019-02-22 01:32:12 +08:00 via Android
    你想做什么?是爬谷歌还是说想要永久存储网页?我唯一建议你云出国。
    我认为你说的是每一条搜索结果下面的标题下面的小字吧?你直接爬出原始链接,然后看 head 里面的 description 就可以了,没有的话直接从正文提取就可以啦。谷歌没有那种说纯文字展示的接口
    Windelight
        2
    Windelight  
       2019-02-22 01:32:51 +08:00 via Android
    @Windelight 如果可以的话请您也把您的方法也贴出来 thanks
    AmItheRobot
        3
    AmItheRobot  
    OP
       2019-02-22 12:57:00 +08:00
    继续求助
    o0OoO0o
        4
    o0OoO0o  
       2019-06-19 10:21:50 +08:00
    有结果了吗?
    AmItheRobot
        5
    AmItheRobot  
    OP
       2019-06-22 19:12:18 +08:00
    @o0OoO0o #4 没
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1077 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 22:28 · PVG 06:28 · LAX 14:28 · JFK 17:28
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.