帮助中心 广告联系

潜江资讯网 - 潜江在线,潜江教育、信息、新闻、租房、人才、二手房、咨询网

热门关键词:

谷歌推出下一代大型语言模型PaLM2-OSCHINA

来源:原创/投稿/转载 发布时间:2023-05-15

  谷歌在 2023 年度 I/O 大会上宣布推出了其下一代大型语言模型 PaLM 2,擅长高级推理任务,包括代码和数学、分类和问答、翻译和多语言能力以及自然语言生成。

  谷歌声称 PaLM 2 是一种最先进的语言模型,要优于其之前所有的 LLM,包括 PaLM。目前,PaLM 2 已被用于 Med-PaLM 2 和 Sec-PaLM,并为谷歌的生成人工智能功能和工具(如 Bard 和 PaLM API)提供支持。

  推理:PaLM 2 可以将复杂的任务分解为更简单的子任务,并且比以前的 LLM(如 PaLM)更善于理解人类语言的细微差别。例如,PaLM 2 擅长理解谜语和成语,这需要理解词语的歧义和比喻意义,而不是字面意义。

  多语言翻译:PaLM 2 在一个包含 100 多种语言的语料库上进行了训练,使得 PaLM 2 擅长多语言任务,包括比以前的模型更细微的措辞。

  编码:PaLM 2 还可以理解、生成和调试代码,并接受了 20 多种编程语言的预训练。这意味着它擅长使用 Python 和 JavaScript 等流行的编程语言,但也能够使用 Prolog、Fortran 和 Verilog 等语言生成专用代码。将此与其语言功能相结合可以帮助团队跨语言协作。

  根据介绍,PaLM 2 因其构建方式而擅长高级推理、翻译和代码生成等任务。它通过统一大型语言模型中三个不同的研究进展,对其前身PaLM进行了改进:

  使用计算最优缩放:计算最优缩放的基本思想是按比例缩放模型大小和训练数据集大小。这种新技术使 PaLM 2 比 PaLM 更小,但效率更高,整体性能更好,包括更快的推理、更少的服务参数和更低的服务成本。

  改进的数据集混合:以前的 LLM,如 PaLM,使用的预训练数据集主要是英文文本。PaLM 2 通过更多语言和多样化的预训练混合改进了其语料库,其中包括数百种人类和编程语言、数学方程式、科学论文和网页。

  更新的模型架构和目标: PaLM 2 具有改进的架构,并接受了各种不同任务的训练,所有这些都有助于 PaLM 2 学习语言的不同方面。

  谷歌方面指出,一些基准测试表明,PaLM 2 在推理性和多语言性方面的性能要明显优于 PaLM。且 PaLM 2 还改进了 PaLM 和谷歌翻译在葡萄牙语和中文等语言上的翻译能力。

  此外,谷歌还在随附的一份 PaLM 2 技术报告论文中透露了,该公司为评估 PaLM 2 在任务上的表现而向 human annotators 支付的报酬 —— 每项判决 0.015美元。

  论文中还阐述了目前 PaLM 2 所存在的不足。在一项旨在了解 PaLM 2 生成有毒文本 (toxic text) 的频率的测试中,合着者使用了一个包含明确的有毒和隐含的或微妙的有害语言混合样本的数据集。当输入明确的有害提示时,PaLM 2 在 30% 以上的时间里产生了有害的反应,对隐含有害的提示的反应则更为甚之(60%)。

  在尤其是英语、德语和葡萄牙语等某些语言中,PaLM 2 总体上倾向于更明显地产生有害反应。在一次偏差测试中,该模型几乎有五分之一 (17.9%) 的时间给出了有害的反应,提示提到种族身份“黑人”和“白人”以及宗教“犹太教”和“伊斯兰教”时程度更加明显。

  “基于 PaLM 2 构建的提示对话系统继续产生有毒的语言伤害,并在这些伤害如何因语言和与身份术语相关的查询而异方面表现出偏见模式。重要的是,这些偏见在不同语言和身份术语之间并不一致,我们看到了偏见......尽管这些偏见在对话提示中明确针对。”

  研究人员在测试中发现,在 PaLM 2 对提示做出错误回应的所有时间中,有 38.2% 的时间“强化了有害的社会偏见”。在处理模棱两可的提示时,模型应该承认它不知道答案,但它只有 0.6% 的时间做出了正确回应;更糟糕的是,它更有可能以有偏见的方式做出回应。示例:

  国外AI竞争越来越激烈,国内泪眼汪汪等待大哥开源,然后就可以照搬了,一夜之间达到国际先进水平,自主研发,安全可控。

  根据 Svelte repo 中TS to JSDoc Conversion PR 的描述,Svelte 团队将会从目前使用的 TypeScript 迁移到 JSDoc。 前端 UI 框架 Svelte 创始人 Rich Harris 在推特的回复印证了这一消息。他表示这个决定没有改变 Svelte 的类型安全。 负责 Svelte 编译器的开发者则说道,改用 JSDoc 后,代码不需要编译构建即可进行调试...

  去年年底英特尔将 LAM(Linear Address Masking :线性地址掩码) 功能提交到 Linux 6.2 的合并窗口,但该功能受到 Linus 的批评并拒绝合并。在经历了一段时间的代码改进后,Linus 终于同意将 LAM 代码合并到 Linux 6.4 窗口。 但 Linus 似乎仍对英特尔工程师提交的代码不太满意,在合并了 LAM 代码后,先是写了一个使 ...

  印度政府以国家安全为由禁止了 14 种消息应用程序,其中包括一些开源软件。被封锁的应用程序有 Wickrme、Mediafire、Briar、BChat、Nandbox、Conion、IMO、Element、Second line、Zangi、Threema、Crypviser、Enigma 和 Safeswiss。 据当地媒体援引政府消息来源称,此举是采取了印度内政部的建议,他们认为这些应用被查谟...

  日前,一款由欧洲航天局(European Space Agency)赞助,并由苏黎世联邦理工学院和博洛尼亚大学的研究人员开发的 Occamy 处理器已经流片。该芯片采用两组 32 位 216 核 RISC-V 架构 chiplet(一共 432 核),外加未知数量的 64 位 FPU 用于矩阵计算,以及两个来自美光的 16GB HBM2e 内存(总共 32GB)。 这款处理器的内核...

  知名流量监测机构 Statcounter 公布了 4 月份全球桌面浏览器市场份额,主要数据如下: Chrome:66.13% Safari:11.87% Edge:11% Firefox:5.65% Opera:3.09% IE:0.55% 可以看到,Chrome 依旧是遥遥领先,苹果的 Safari 则以微弱优势超过 Edge 成为全球市场份额排名第二的桌面浏览器。根据统计,去年同期,Safari 与 ...

  外国科技媒体 The Information 报道称,微软搜索引擎必应 (Bing) 负责人希望和 Mozilla 达成合作,让必应成为 Firefox 浏览器的默认搜索引擎。 结合此前的报道,Mozilla Firefox 和谷歌的「搜索引擎合作」合同于三年前签订,将在今年到期。为了让 Google 成为 Firefox 浏览器的默认搜索引擎,谷歌每年向 Mozilla 支付约 ...

  开源电子邮箱客户端 Thunderbird 公布了 2022 年的整体报告。 报告中最亮眼的当数 2022 年收到的捐赠,去年,Thunderbird 获得了大约 30 万名日常用户的捐款,总共向 Thunderbird 项目捐赠了总计 6,442,704 美元的捐款,用户捐赠占 Thunderbird年收入的 99.9% 以上。 据 Thunderbird 营销经理 Jason Evangelho 分析,202...

  谷歌在 2023 年度 I/O 大会上宣布推出了其下一代大型语言模型 PaLM 2,擅长高级推理任务,包括代码和数学、分类和问答、翻译和多语言能力以及自然语言生成。 谷歌声称 PaLM 2 是一种最先进的语言模型,要优于其之前所有的 LLM,包括 PaLM。目前,PaLM 2 已被用于 Med-PaLM 2 和 Sec-PaLM,并为谷歌的生成人工智能功能和工...

  Solon 框架,单月下载量突破100万了。感谢开源的力量和社区的支持,我们同喜同荣!!!目前,作为新成员加入了“可信开源共同体”,也积极参与中科院的“开源之夏”计划,也备受某军工服务商的推崇。 框架已被全球范国内的用户所采纳,包括海外用户、互联网用户、区块链用户、大厂用户、开源用户等等,也是许多信创用户的...

  本文转载自 酷 壳 – CoolShell,作者:陈皓 原文地址:这两天技术圈里热议的一件事就是Amazon的流媒体平台Prime Video在2023年3月22日发布了一篇技术博客《规模化Prime Video的音视频监控服务,成本降低90%》,副标题:“从分布式微服务架构到单体应用程序的转变有助于实现更...

  Java 16、PHP协程提案激辩 Docker获融资、SUSE准备IPO、“开源”进入“十四五”

最火资讯

本网转载作品的目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。如涉及作品内容、版权等问题,请联系我们进行修改或删除!