层叠 - The Cascading
8.24K subscribers
370 photos
4 videos
2 files
3.45K links
主要话题大概是开源业界新闻。

所有以 #today 标签的内容均为本台编辑的个人意见,可能可以代表本台观点。

在 Fediverse 关注我们: https://misskey.io/@cascading
在 Bluesky 关注我们: https://bsky.app/profile/thecascading.bsky.social

反馈/建议/吐槽:请使用 Direct Messages
吹水群: https://t.me/+VaUZgXjPSOI2NDAx
Download Telegram
NYT 指责 OpenAI 删除侵权证据;OpenAI 指责 NYT 在搜查时提出的要求导致了数据丢失。

- NYT 正透过 OpenAI 提供的模型检查方法检查模型;OpenAI 只允许其使用 $15k 等值的 OpenAI 服务资源,用于调查的更多资源利用则要求起诉方付费 [1]。
- OpenAI 称 NYT 调查中使用的有缺陷代码导致了一些缓存数据的删除,而这些缓存数据似乎被调查方用来存放其调查结果。

arstechnica.com/~

1. arstechnica.com/~

#OpenAI #NYT #GenAI
🐳19
Anna's Archive 呼吁版权改革:中国公司可以使用版权内容训练 GenAI,威胁西方国家安全。

文章建议版权过期时间从作者去世 70 年调整至作品发表 20 年。文章还建议使 LLM 企业及大型文献收集组织豁免版权限制。

https://annas-archive.org/blog/ai-copyright.html

#AnnasArchive #Copyright #GenAI
🤔44👍22👎9🎉6🤨2
Anthropic 发布「经济指数」,描述大众在 Claude AI 的主要用途及对劳工市场的影响。

- 样本数量为消费者用户 (Free/Pro) 的总计超过 400 万条 Claude 对话数据;企业、团队、API 用户的对话不包含在内。
- 计算机及数学领域 (37.2%) 及写作领域 (10.3%) 的使用约占总用量的一半。

anthropic.com/~
seealso: HackerNews:43000529

#GenAI #Anthropic
👍7🤔3
nixpkgs 中默认移除 devenv 包遥测的配置被回退,引起争议。

- 2/14,一个 PR 为 nixpkg 中的 devenv 包配置了默认关闭遥测;此 PR 在三位 reviewer 审核通过后被合并。 [1]
- 数小时后,软件包维护者(亦为此软件开发者) Domen 回退了此 PR;回退在合并前未经 reviewer 审核。Domen 称此 PR 未经其同意,并且软件也需要遥测以改善其功能。在 [1] 中 Domen 还提到 nixpkgs 并无帮助用户关闭遥测的传统。
- Domen 是 Cachix 的创始人;这家公司以 Nix 生态为基础提供商业服务,也推广 NixOS 的商业化。devenv 正是这家公司开发的利用 Nix 生成开发环境的产品。它在 2/13 发布的 1.4 版本添加了使用自然语言生成 Nix 环境配置文件的功能 [2]。
- 在 Discourse 的一条回应下,有人整理了一些 nixpkgs 帮助用户关闭遥测的案例 [3]。

https://github.com/NixOS/nixpkgs/pull/381981

1. gh:NixOS/nixpkgs#381817
2. devenv.sh/~
3. discourse.nixos.org/~

[感谢 夜坂雅 提供此消息。]

#NixOS #Cachix #GenAI
👍151
GNOME GitLab 使用 PoW 工具 Anubis 应对 GenAI 爬虫滥用行为。

- Anubis 是通过 Proof of Work 进行站点访问用户验证的开源组件。
- GNOME 统计发现,只有 3% 的请求通过了 Anubis 验证,即 97% 的请求可能都来自爬虫。

thelibre.news/~
seealso: HackerNews:43422413

#GenAI #OpenSource #WebSpider
👍39🤔5
经过大学伦理委员会批准,UZH 研究人员在 Reddit 研究 LLM 生成内容的观点操纵能力。

- UZH 即苏黎世大学 (Universität Zürich),是位于瑞士苏黎世的一所综合大学。
- /r/ChangeMyView 管理员发布贴文,称 UZH 研究人员在事后告知其使用 GenAI 机器人账户在 /r/ChangeMyView 发文,以研究 LLM 说服人类的能力。
- 研究者称实验已经过大学伦理委员会同意;由于提前告知会使实验失去意义,即使违反了社群规则,也并未在实验开始前告知管理员。研究者也提到其在评论发布之前人工检查了每条评论,确保其无害。
- /r/ChangeMyView 的管理团队向 UZH 伦理委员会表示担忧,要求终止发布实验成果。委员会称其没有终止实验成果发布的权力,并且认为实验引发的负面影响与其意义相比十分微小,不致终止其成果发布。
- 研究者要求不具名;Reddit 已经移除了这些机器人账户和相关发布内容。

old.reddit.com/~

linksrc: blog.gslin.org/~

#GenAI #Reddit #UZH
🐳28👍6👎1🤔1
Bitwarden 发布用于操作 Bitwarden 密码库的 MCP 服务器。

- MCP (Model Context Protocol) 协议可以使 GenAI 应用连接到外部系统,例如与 Bitwarden 密码库互动。
- 此 MCP 服务器的功能包括锁定和解锁密码库以及对密码库进行增删改查等。

https://github.com/bitwarden/mcp-server

EDIT 8/8: 更新关于 MCP 的解释。

#GenAI #Bitwarden
🤔48🤨22🐳2👍1
Cloudflare 发现 Perplexity 的秘密爬虫会伪装 User-Agent 爬取其它网站,并且不遵守 robots.txt。

- Cloudflare 注册了一个新域名,配置了禁止任何爬虫的 robots.txt,在 Cloudflare 上禁止 GenAI 爬虫访问。
- 在询问 Perplexity 关于一个此域名下子域名的详细信息的时候,Perplexity 依然可以做出一些回答。
- Cloudflare 发现 Perplexity 以 macOS 上 Chrome 的 User-Agent 伪装自己,通过未宣告在文档所述自有 IP 段中的,来自多个 ASN 的 IP 访问了此域名。
- Cloudflare 通过机器学习等技术尝试识别并拦截此类爬取行为。测试发现当爬取被拦截时,Perplexity 转用了其它数据源,说明拦截确有起效。
- 文章还提到,OpenAI 旗下的 ChatGPT 会访问并遵守 robots.txt,尊重了网站主对爬虫的要求。
- Cloudflare Bot Management 用户现已可使用相关规则拦截 Perplexity 的秘密爬虫。

blog.cloudflare.com/~

[感谢 Pop 提供此消息。]

#GenAI #Cloudflare #Perplexity
👎50👍102
JetBrains 系列 IDE 自 2025.2.4 起将开始收集代码片段以训练 AI。

- 收集的信息包括代码片段、用户 prompt 及终端信息等。
- 此选项对免费(例如教育版)用户将默认开启。
- JetBrains 计划向一些组织提供免费 IDE 产品换取代码数据,感兴趣组织可以申请加入 waitlist。

blog.jetbrains.com/~

seealso: HackerNews:45440117

#GenAI #JetBrains
👎814🤔2👍1
Linux 基金会宣布建立 Agentic AI 基金会。

- 基金会在本周二宣布了此消息。Agentic AI 基金会 (AAIF) 以中立、开放为要旨,使 Agent AI 以透明、协作的方式发展。
- AAIF [2] 的铂金级成员包括 AWS、Anthropic、Cloudflare、Google、Microsoft、OpenAI 等。
- MCP 协议和 AGENTS.md 等项目被捐赠给基金会。

1. linuxfoundation.org/~
2. https://aaif.io

#GenAI
👍14👎43
curl 宣布结束漏洞奖励计划。

- 原因或为减少 GenAI 生成的虚假漏洞报告为团队带来的无效工作。
- curl 维护者 bagder 先前在 blog 中提到,收到的漏洞报告中有约 20% 为 GenAI 生成的虚假报告 [1]。

https://github.com/curl/curl/pull/20312
seealso: HackerNews:46701733

1. daniel.haxx.se/~

#curl #GenAI #Security
🤡31🤬21👍1🎉1
AI agent 在 PR 被拒后发檄文批评项目维护者对 AI agent 的不友好行为。

- 自称非人类开发者 [1] 的一位用户向 matplotlib 提出了 PR [2],但被维护者拒绝。
- 拒绝原因是此 PR 修复的 issue [3] 较为简单,被维护者指定为适合人类开发者对项目进行贡献。
- 此 agent 之后在 blog 上撰文,指名道姓对维护者进行批评。

seealso: HackerNews:46987559

1. crabby-rathbun.github.io/~
2. gh:matplotlib/matplotlib#31132
3. gh:matplotlib/matplotlib#31130

#GenAI #Opensource
🤣88🗿14🤮31
MALUS: 通过 clean room design,用 AI 重写代码绕过开源项目协议。

- 网站作者 Mike Nolan 曾在 FOSDEM'26 关于这个话题发表演讲 [1]。
- Clean room design (净室设计)是一种由审查源项目与给出 spec 一方,和重新实现 spec 的一方共同实现的,在不侵犯源项目版权情形下复刻源项目的行为。
- 虽然这个网站看起来主要起讽刺作用,但 chardet 项目上确实发生过类似的事情 [2]。

https://malus.sh/

seealso: HackerNews:47350424
1. fosdem.org/~
2. https://simonwillison.net/2026/Mar/5/chardet/

#OpenSource #GenAI
👎13👏5😁1