到底删除了多少模型?
根据字节网友后来发到网上的疑似截图显示,被删除的只是:“Lagrange Lite 全量 Batch 模型的备份”,且显示为「被误删」。
又有字节的工程师网友表示删除的都是离线数据,影响不大。
该楼主好像对此事非常热衷,全程在线跟帖,表示“确实影响不大但是麻烦,重新训练模型和延迟上线理论上都会对指标有负向只是不那么明显了”。
实习生“立大功”
2018 年据英国《金融时报》报道,谷歌内部一位实习生无意中犯下一个“小”错误,导致一则没有意义的广告投放到“大量”网页和应用中,持续了大约为 45 分钟,相关费用和清理成本达到 1000 万美元,真可谓小手一抖,千万元没有。
2、字节 AI
字节都有什么出名的机器学习产品?
字节跳动最早是以今日头条来闯荡江湖,在今日头条以及后来的抖音和火山等产品上肯定用到了不少机器学习推荐算法,这就先不提了。
此外,在抖音这款“有毒”的产品上,也时不时见到各种运用 AI 算法来做人脸变化的技术应用,比如最近的在抖音上比较火的重返 3 岁的 AI 特效等等。
据 AI 科技评论 所知,字节还开源过一个名为 LightSeq 的序列推理引擎,它对以 Transformer 为基础的序列特征提取器(Encoder)和自回归的序列解码器(Decoder)做了深度优化,早在 2019 年 12 月就已经开源,应用在了包括火山翻译等众多业务和场景。
据了解,这应该是业界第一款完整支持 Transformer、GPT 等多种模型高速推理的开源引擎。
LightSeq 可以应用于机器翻译、自动问答、智能写作、对话回复生成等众多文本生成场景,大大提高线上模型推理速度,改善用户的使用体验。
相比于目前其他开源序列推理引擎,LightSeq 具有如下几点优势:1. 高性能;2. 支持模型功能多; 3. 简单易用,无缝衔接 Tensorflow、PyTorch 等深度学习框架。
据 AI 科技评论 所知,字节跳动 AI Lab 最近计划要开源「新版训练加速引擎」,可以让模型训练加速 3 倍以上。
最后,据这次的误删除事件来看,1GB 的模型其实不算大,大概只有几亿的参数量级,反观现在 AI 江湖动则千亿万亿起步的模型,1GB 以下的模型真的不算大,算不上是决定性的模型。
或许此次事件对字节只是一件不痛不痒的小事,字节的高层或许压根不知道此事,毕竟这又不是删库跑路。
虽说如此,但程序里的 bug 是个玄学,有时哪怕某个小 bug 产生的影响往往也是难以预料的,有时会牵一发而动全身,若是赶巧也可能影响整个产品线。
但是,还是希望各位公司谨记「天干物燥,小心火烛」。