
四个00后的疯狂开源计划:整个互联网转成大模型语料,1亿token嵌入成本只...
Arxiv 上所有论文转成 Token,加起来不过 14.1GB 而已。这是最新爆火开源计划亚历山大完成的壮举。事实上,这还只是第一步。他们最终是想要将整个互联网变成 Tokens,换言之全都转化成 ChatGPT 等大模型理解这个世界的方式。
Arxiv 上所有论文转成 Token,加起来不过 14.1GB 而已。这是最新爆火开源计划亚历山大完成的壮举。事实上,这还只是第一步。他们最终是想要将整个互联网变成 Tokens,换言之全都转化成 ChatGPT 等大模型理解这个世界的方式。