PO文学

第71章 礼物
章节错误/点此举报

小贴士:页面上方临时书架会自动保存您本电脑上的阅读记录,无需注册
    重生2008:从助教逆袭为院士 作者:佚名
    第71章 礼物
    车子到了楼下后,吴辰终於放下了手机。
    人无聊了別说用3g刷网页了,连洗髮液包装上的字都能逐字细读。
    他看姜楠好像脸色很冷漠的样子,於是建议道:“要不上楼休息一下再回去?”
    姜楠的拒绝了,但她还是好心提醒道:“你快上楼吧,明天还要上早八,而且吴淑芬估计饿了两天了。”
    “还好吧,它挺能挨饿……这个给你,送你的礼物。”
    吴辰也没说他让閔欣柔帮忙的事,而是从包中把机场买的《三体》递了过去。
    姜楠接过后,借著车里微弱的氛围灯看了几行,略微诧异。
    “谢谢。”
    “不用。”
    吴辰说完就上楼了。
    看著他的背景消失在单元门中,姜楠才踩下油门,同时给陈蓓桃拨了电话过去。
    “姜姜,你该不会在玩什么很奇怪的游戏叭?”
    陈蓓桃警惕道。
    姜楠奇怪道:“什么游戏?”
    “就是那种一边打电话一边昆的游戏鸭~”
    “无聊。”
    姜楠忍不住啐了一口。
    虽然两人都没谈过恋爱,但陈蓓桃是个理论高手,阅片无数,所以她们的闺蜜密语也是很黄很暴力。
    只不过外人难以想像罢了。
    瞎扯了几句,姜楠问道:“是你和吴辰说了我是大刘的粉丝吗?”
    大刘就是刘慈欣,国內著名的科幻作家,《乡村教师》、《全频道阻塞》和《三体》这些都是他的代表作。
    “没有鸭~”
    “哦。”
    姜楠淡淡的应了一声。
    难道是吴辰从別的地方打听到了她很喜欢看科幻小说?
    会不会是自己母亲告诉他的?
    姜楠觉得大有可能。
    不过陈蓓桃並不知道吴辰送了姜楠《三体》。
    她只是兴奋道:“姜姜,送你的那支钢笔可是吴大佬用过的哦,我特意拿给你的,嘻嘻~”
    “……”
    -----------------
    吴辰是真不知道姜楠也爱看科幻小说,他只是按自己喜好买的。
    回到家中,空气中还残留著閔欣柔身上的梔子花香。
    吴辰在屋子里溜达了一圈。
    家里被打扫的异常乾净,连边边角角里都被擦的一尘不染。
    他又掀开吴淑芬的尾巴瞅了瞅,发现它的屁股也很乾净,看来閔欣柔也帮它洗了澡。
    “真是个温柔的好姑娘啊。”
    吴辰忍不住感嘆了一句。
    简单洗漱了一下,他便准备开启今天的深度阅读。
    但电脑开机后,他发现桌面上多了一个文档。
    標题是《给吴老师.doc》。
    打开后,里面先是閔欣柔列的一个表格,详细说明了她把各种零碎物品放在了哪里,还有衣服分类存放的位置。
    第二部分则是她这两天的学习感悟以及一些不懂的问题。
    吴辰看了一遍后,將她的问题仔细回復好,然后把文档发到了她的qq上,留言有问题隨时交流。
    看的出来閔欣柔的数学功底很好。
    至少吴辰在论文中用到的算法她都能理解。
    尤其是高维向量的部分。
    有一些大四的学生可能都没搞懂,但她却能轻鬆运用。
    吴辰打算回头问问閔欣柔愿不愿意读研。
    如果她能一直保持这种学习態度,那下学期他可以推荐她一个保研的名称,顺便给她找个好点的导师。
    ……
    处理完杂事后,吴辰便开始了自己的研究。
    今天他选择研究的方向是:基於语义密度的自监督文本去噪算法
    原因是他现在已经確定可以获取到讯飞、搜狗和天涯社区的文字內容。
    但还需要经过处理,才能用作人工智慧训练的语料。
    举个例子。
    假设他现在拿到了天涯社区里的一篇贴子是《大家畅想一下,二十年后的手机会是什么样子?》,內容是讲网友对未来科技的预测。
    帖子的主体及高质量回復,就可以作为训练人工智慧大模型的优质材料。
    但除了正常回復外,还会有各种gg、水帖。
    比如“沙发”、“顶”、“楼主好人”或者纯表情等等。
    这些没有价值的回覆,就称之为噪音,需要清除掉。
    正常来说,是需要人类去完成这一步的。
    openai就曾被爆料僱佣了肯亚黑奴来帮他们清洗数据,时薪不到2美元。
    吴辰也想,但他还没那么多钱,所以就只能用技术来搞定了。
    而基於word2vec的无监督文本噪声过滤技术,就是最好的选择。
    它可以通过word2vec,先將帖子主体转化为高维语义向量,再把每一条回帖也转化为对应的向量,最后计算两者的余弦相似度,来判断回帖是否与主题相关。
    相似度高的內容,在数学空间里就会聚集成一个紧密的球体。
    相似度高於设定閾值的,就判定为有效回復,將来作为训练数据的“问题-答案”语料对。
    比如当別人问道“王muaa的读者2026年会怎样?”
    那么人工智慧会从向量空间中查找相似度最高的內容。
    那么结果就是:2026年会发大財。
    这就是將文字转换为数学的重大作用之一。
    当然,由於2008年的硬体限制,即使吴辰提前完成这项技术,也只能进行初步的筛选,后续还要靠人工来完成最终的结果。
    但也已经能省很大一笔钱了。
    而且由於他在高校工作,还能很方便的找到廉价又老实的大学生。
    不仅帮学校解决了就业实习问题,还能让学生们赚点小钱,也算是功德一件了。
    一个小时的深度阅读很快就过去了。
    吴辰估算了一下,他需要再看一星期,才能把相关的前期工作准备好。
    毕竟这是一件很复杂的技术。
    而且最关键的,还是硬体跟不上。
    必须要想办法解决硬体瓶颈才行。
    但在2008年,英伟达最好的显卡也只是gtx280。
    而且cuda才刚出现一年,根本满足不了他的需求。
    而且如果从一开始就依赖英伟达,那么后期麻烦只会越来越多。
    只能想办法自己造了。
    简单规划了一下技术路线后,吴辰便洗洗睡了。
    -----------------
    第二天,吴辰在结束下午的课程后,接到了许建平的电话。
    重生一次,他来校长办公室的次数比上辈子十年都多。
    看到他过来,许建平顿时喜笑顏开。
    他乐呵呵的对吴辰道:“吴教授,你这次去帝都可是收穫不小啊。”
    “也多亏了您的领导。”
    吴辰说著不咸不淡奉承话。
    许建平笑著摆摆手,然后向他介绍办公室里的一个中年妇女。
    “这位是后勤处资產管理科的孙老师,负责落实学校给你房子的事情,小吴你和她对接一下,等会儿就能去看房了。”
上一页        返回目录        下一页

温馨提示:按 回车[Enter]键 返回书目,按 ←键 返回上一页,按 →键 进入下一页。