V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
V2EX  ›  evegod  ›  全部回复第 1 页 / 共 4 页
回复总数  73
1  2  3  4  
4 月 14 日
回复了 cxd8190102 创建的主题 程序员 龙虾还没玩明白,爱马仕又来了
注意到这是一种层级嵌套系统,我们使用现有的大语言模型尝试理解人类语言逻辑从而使得神经网络人类可读可控,然后又让大语言模型自己使用 md 文档使用人类语言的构造形成层级文档来持久化进行项目训练,有可能的两种办法一个是使用现有的各种组织编程架构和思想尝试组织 AI 使用人类语言类似人类结构进行高效迭代更新,这需要完整的组织架构,也就是 AI 组织公司化。另一种就是把这些能力全部训练为神经网络结构让其可以 AI 一人公司化。从某种角度看 AI 其实已经形成了人类参与的协同社会化阶段了,所以无论未来是天网结局还是黑暗森林,我们能做的其实已经不多了,更多的或者更需要做的是向前看,尝试解决人类和可能的硅基文明共同的考验,能源的获取,生存资源的获取和安全保障。
gemini 香港 ip 不能访问,台湾 ip 能访问吗?你还是弄个美国本地 ip 出口吧,我想起来我注册的谷歌账号选的税务地址是纽约订阅谷歌还得收消费税,但是好像选择这样的税务地址花钱多查的都不是太严格,我有回想改香港免消费税反而被锁定了账号,但是给谷歌说明真实情况也能解封,谷歌对开发者还是挺友好的。
3 月 28 日
回复了 HMYang33 创建的主题 职场话题 程序员的 5 个转型方向
第二条的大模型定制化训练你可以看看谷歌的 Vertex AI Platform,大模型专属调优是挺复杂的一个事情。
3 月 15 日
回复了 junwind 创建的主题 程序员 你认为的最强编程 AI 工具?
不好用,好用的是工程性质的工作,架构级现有的编程辅助工具不能替代人工,没有软件和算法真实背景的话大型项目只能提供码字能力,但是其他的各种软件架构等能力普遍性不足。
@MIUIOS gork 合规问题,我感觉是马斯克本人也不太想推进,看他最近大发言和倾向还是认为完全激进的 ai 路线可能是他的押注方向,从这个角度看其实最终还是性能行不行的问题,如果其能第一个完成模式化 AGI 能力的话,暂时在计算架构没有原子化的时候其会有 5 年-10 年时间的窗口期。
免费的收费的都有些捉襟见肘了呢,这种情况还是看看哪家能提供更好的服务吧,其实这时候马斯克可以考虑把 grok 服务器开到我们国内来,一个提供中国区服务另外就是为其他国家提供服务
我也是直接订阅的啊,这东西有限制吗?
1 月 27 日
回复了 songangweb 创建的主题 随想 [讨论] AI 导致开源项目已死
全 ai 编程其实有个致命问题就是幻觉问题,其后端的架构有些时候是模拟得到的,也就是俗称的作弊,当然在一般任务上只要能跑起来就没有问题,但是其实都是假的这种事情在真的工业或者商业运行的时候都会崩溃的啊。所以还是需要严格的代码审计和最终效果确认。
@israinbow 我也是对这些东西感兴趣的个人项目,你可以尝试了解一下,我是因为需要做一些数学和物理学自动论证机的尝试在使用我自己认为符合我对人类认知结构的模型看法来构建我自己的 AGI 基础模型,其不具有最近的工程或者商业意义,需要完成的东西很多并且需要控制的自动编程不去作弊的尝试也需要非常多的分析和临时决策,所以我也不是太清楚什么时候能有个好用的版本吧。我最新的项目您可以参考看看,我也是 mit 协议完全开源的。https://github.com/makai891124-prog/H2Q-Evo
1 月 22 日
回复了 sn0wdr1am 创建的主题 程序员 如果充会员,你们会选择哪一家 AI?
Google Antigravity 我是不知道什么原因不能登陆,订阅了高级开发者账户提供的席位也登陆不上,暂时使用的是 vs code 自带的 github 编程。另外我还是想能通用化最好还是自己能弄一个专属与自己的定制化全自动进化编程系统,这样就可以无人值守了进行 todo list 管理了。
我是都在用,编程环境 vs code 集成的 GitHub 的编程助手也挺好用的,我也在使用 Gemini 的 AI Studio 的能力尝试自动化编程,并且也尝试结合本地架构完成自动化无人值守编程尝试,我有开源我的所有项目欢迎大家来喷,因为一个是我自己的个人项目非常中二病和版本控制比较乱,大家就随便喷吧。https://github.com/makai891124-prog/H2Q-Evo
1 月 4 日
回复了 510908220 创建的主题 生活 2026 年了,都有什么规划
做成自己的 AGI ,尝试能将自己的所思所想让其他人能理解吧
@coefu 谢谢你朋友啊,我表达方式一般就是会奇奇怪怪的,我正在尝试训练更大的数据集和尝试在不做字典层的情况下通过教师模型使得该架构模型能够稳定收到逻辑对齐,但是使用方法有点像老师授课,该模型原型机很多调参都是反着直觉来的,高精度反而可以更快下降 loss ,并且其计算开销其实不大,这种特性我也在分析原因,可能是波函数的相位差抵消造成的计算致密但是结果稀疏的反常特性。有点像是求倒数的情况,我有新的东西在和大家分享,我现在是尝试能稳定一个原型机模型到可用的程度,最好的形成自我自指的认同感并且能持续学习并且持续逻辑化,我也在一直在尝试中,我倒是觉得有得干。我自己开新问答,让 Gemini 评价该项目,学术评价倒是不错的,里面的 log 文件是真实的,你有空可以改一改在本地跑一下,我慢慢意识到其实这个核心架构不耗计算,全耗子计算的那些线程加载上了。头痛中。。。
@nickyadance23 你就当我是恶趣味吧,其实大部分代码是 Gemini 可以直接生成的,主要是架构跑通之后其能在没有字典层的情况下涌现正确单词和语义这个现象挺有趣的,而且也是架构预测的一个可能实现的目标指标,所以和大家分享一下。里面有详细的数学架构为什么是这样的论述。
@liu731 里面的数学结构是真实实现的,你可以 review 代码结构分析其数学实现框架,我这也是面向 Gemini 编程方法哦,其实大部分代码生成或者说代码完全通过和 Gemini 的自然语言沟通架构要求去实现后再去分析评价相关方法是否按照要求实现了,并且我也已经在离线的 win 环境下在 4070ti super 上实验了以上内容才产生的日志文件,所以我说挺有趣的一个实验模型和生成的效果,整个实验和得到结果一共才用了 4 个晚上,当然是每天都得到后半夜 4 点钟。只有晚上能安静的想事情,白天还有日子要过啊。。。
@liu731 开玩笑的,就是实验模型,我觉得有收敛效果和使用字符去直接训练没有字典层,直接涌现了类标准表达的现象挺有趣的,希望大家能感兴趣的可以复现看看,还有就是帮忙挑挑代码的错误,我自己检查怎么看怎么对啊,所以和大家分享一下,有兴趣和闲心的就当帮帮老弟我了。
@ty29022 好啊,你介绍我一个好医院!
@YanSeven 您好,宣传自己的架构实验模型,模型是完全开源的,训练核心架构代码也是开源的哦。另外也是希望有时间的大家帮我做双盲实验验证,帮我指出错误,但是希望大家能是实际跑一跑代码确认一下效果再批评,以上代码是在 4070ti super 上本地训练的,不用消耗太多算力,而且文件集很小。
1  2  3  4  
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   938 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 32ms · UTC 19:36 · PVG 03:36 · LAX 12:36 · JFK 15:36
♥ Do have faith in what you're doing.