工作&学习
这两个部分凑在一起是因为对我来说是无差别的。
在今年前,对安全的概念还停留在下载攻击脚本,敲一行命令就能产生某种效果,但是对像二进制和逆向工程真的是一知半解,甚至于打ctf时遇到此类题会先搜wp再跟着做,完全就是拥有过剩的精力和极强的虚荣心,缺乏耐心钻研技术原理的那种群体(。
非常幸运地2025能经常有超过一整段>7天的时间完全留给自己在电脑前,因为没有确切目的和偏好的范围,所以急功近利的心态有很大改正。从不带脑子下载脚本既开即用,也在完全放空的假期学会了从简单的底层工具写起,还在朋友的影响下学会多看RCE报告和windows内核相关。
机器学习和LLM方面是和工作相关,所以强度相较于去年是显著拉高了不少…..接触的项目从下游任务调参和基准模型优化,过渡到了实际应用的Attention机制优化和拿对齐算法引入自研模型qwq虽然道阻且长,但是这方面的工作是满足了我对一份好工作的标准:1)Reward function不会边际效益递减,同时实现难度不会指数级提高 2)具有正外部性,在满足自己的同时为社会创造了价值 3)能积累复利。
2025年理解了Priority setting是什么,但是没有践行,我识别不出来什么事最要紧,也没有在重要的事情投入足够多的资源,做到的只有在不重要的事情上忍受了做不好的痛苦。
既然目前工作和学习都规避不了AI使用,那就只能正视了;今年讨巧地拿AI辅助阅读的论文其实在脑皮层已经顺溜的滑过了,真正意义上的人工古法阅读的那几篇倒是可以做到引经据典,所以在意识到之后会把重要论文放在人工阅读这个格子里,前沿但是不重要的论文放在辅助阅读格子里。
生活
2025年带着小怜去了国内很多地方小住,本意上是想筛选自己适合什么地形气候、物价水平、人际关系圈和交通,但是最后无一例外变成了在家里躺着,没事就出去玩玩和找家咖啡店写东西,所以对我来说无论是曼哈顿还是重庆大概都会保持同一个生活状态。

唯一摸排出自己的喜好就是喜欢海,还有口味重一点的食物……

学会了自己搓假毛,虽然还是坑坑洼洼的但是请看对比图:

会用缝纫机做裙子了,还学了基础的制版,目前还没有学以致用在bjd上的空间

人和AI一样,最重要的是Reward model如何构建。有的人最核心的奖励信号是成就感,有的人是权力,有的人是钱,是爱,是意义感和发现。在 AI 眼里,人类的这种差距可能类似于食肉动物和食草动物的差距。
闲下来无东西可琢磨的时候会想一下怎么建立一个健康的人生Reward Model,想解决时空尺度的问题,但是不知道怎么通过设计合理的中间奖励,让我在做那些短期痛苦但长期正确的事时能获得正向反馈,也不知道怎么能确保我每一天的局部最优解最终能汇聚成整个人生的全局最优解?
这些问题抛给AI肯定会得到若干段高质量的回答,但是给出的答案太宽泛我也做不到。目前来看唯一挨的着边的是在实践中受挫来不断校准自己的奖励权重,防止过拟合于过去的成果(其实是因为没有成功过)而导致未来的崩溃。
2026
今年还是沿用去年的生活方式,只是要小住的地方增加了上海,还有久违的出国目的地定在新加坡和韩国、我还没有去过樟宜机场外面,之前只是转机的时候短暂地呆了俩小时,这次想去坡县的环球影城和夜间动物园;韩国的话就是面诊一下脸,体验一下便宜的乔雅登和去补一下下巴。
开年愿望的话就许小牧爱佳再贩QAQ今年希望能做出些许的成果,早睡早起消掉黑眼圈,整容手术顺风顺水有满意的效果!