硬核观察 #957 Twitter 要求 GitHub 披露其源代码上传者的身份
| 2023-03-31 21:06:52 评论: 0
Twitter 要求 GitHub 披露其源代码上传者的身份
Twitter 上周披露它的部分源代码被人在今年初上传到 GitHub,当时 Twitter 刚刚被收购并解雇了数千名员工。上周五 GitHub 在 Twitter 的要求下删除了该仓库。本周二,法庭应 Twitter 要求 GitHub 在 4 月 3 日前提供上传者所有的身份信息,包括姓名、地址、电话号码、电邮地址、社交媒体资料和 IP 地址。此外,还要求提供下载和修改该代码仓库数据的用户信息。
老王点评:这有点过分了啊。
开源聊天机器人在质量评估上能达到 ChatGPT 的九成
开源聊天机器人 Vicuna-13B 基于 Meta 的大语言模型 LLaMA,它使用了用户通过 ShareGPT 分享的 7 万对话样本进行微调。研究人员让 OpenAI 的 GPT-4 作为裁判,去对比 Vicuna-13B 以及 ChatGPT 和谷歌 Bard,结果显示它在质量评估中能达到 ChatGPT 的 92%,而 Bard 为 93%,LLaMA 为 68%。Vicuna-13B 的训练成本只花了 300 美元。研究人员还计划释出其模型权重。
老王点评:这说明并一定非得用海量的参数、巨额的训练费用,也可以取得可观的 AI 效果。所以,AI 也会有类似的“摩尔定律”,会随着时间迅速降低 AI 成本和提高 AI 效果。
超过一半的新 NPM 包是 SEO 垃圾包
目前提交给 NPM 的所有新包中,有一半以上是 SEO 垃圾。这是一种空包,只有一个包含各种恶意网站链接的 README 文件。在过去一周 Sandworm 扫描的 32 万个新的 NPM 包或版本中,至少有 18 万个被标记为 SEO 垃圾。检测到的大多数垃圾包都来自一个俄语的 Telegram 频道。
老王点评:为什么 NPM 没有发现并做成反应?