我第一次用AI生成的代码报软著是前年,当时公司要申请高新,还差2件软著,研发部都在赶项目没人腾得出手写材料,我就抱着试试的心态,把产品需求文档喂给GPT,生成了全套前后端代码和操作手册,当时心里也打鼓,怕交上去直接被打回,甚至算造假影响公司高新申请,最后咬咬牙改了两天代码才提交,结果26个工作日就下证了,连补正都没收到。
很多人问AI软著会不会被查,首先得搞清楚软著审查的逻辑是什么。我接触过的版权中心审查,根本没有大家臆想的那种专门扫AI生成内容的工具,核心卡两个点:一个是源代码的重复率,另一个是申请材料的一致性。现在重复率超过30%是最常见的驳回原因,不管你是手写的还是AI写的,只要和已登记的软著源代码重合太多,都会被要求补正说明原创性。我之前有个朋友自己手写的工具类代码,因为用了很多开源的公共方法,重复率飙到47%,照样被打回来,和是不是AI写的没关系。
真要说到AI软著容易被查出来的场景,基本都是自己太懒没改内容。比如我之前带的实习生,图省事直接把AI生成的3000行代码原封不动交了,连里面AI自动生成的注释“这里可以根据业务需求调整参数”都没删,提交上去不到10天就收到补正通知,要求说明代码的原创性,最后改了快两周,把所有变量名、逻辑分支都改成符合我们公司业务的内容,还补了研发过程说明才过审。还有人更离谱,AI生成的是外卖调度系统的代码,操作手册写的是门店收银系统,两边完全不搭,审查员扫一眼就知道有问题,直接驳回。
要是你也打算用AI辅助写软著材料,完全不用太慌,照着我这几年的经验改,基本不会出问题。首先AI生成的代码拿到手,先把所有默认变量名、函数名改成自己项目的命名规范,比如AI生成的用户表叫user,你可以改成biz_user,多加点和自己业务相关的字段,比如我们做教育系统的,就加了student_level、course_count这类独有字段,一下子就能把重复率拉下来。然后注释全部删掉重写,不要留AI生成的那种通用注释,就写自己项目里这个逻辑是用来干嘛的,比如“计算学员当期课程的剩余课时,关联请假规则扣减”,这样哪怕审查员看源代码,也能看出来是你自己的业务逻辑。
改完代码最好先自己查一遍重复率,省得提交了才被打回来耽误时间。我之前改完代码怕重复,顺手用软著Pro查了下重复率,确实比自己逐行比对效率高太多,2分钟就出结果,还能标出来哪几行和已公开的代码重复,直接对着改就行。现在很多代理提前做软著重复性检测就是为了避免踩这个坑,毕竟一旦补正,最少要多花半个月的时间,赶项目 deadlines 的人根本耗不起。
还有人担心会不会以后出专门的AI生成代码检测,至少我最近两个月提交的5件软著,都有不同程度用到AI生成的代码,改完之后提交全都一次性过了,没有遇到任何和AI相关的审查问题。其实换个角度想,现在程序员写代码哪有完全不用AI辅助的?查个语法、写个通用工具类都要搜一下或者问AI,只要核心的业务逻辑是你自己的,AI只是提升效率的工具,根本谈不上造假,也不会被刻意针对。
当然也不要抱着侥幸心理,觉得随便抄点AI生成的内容就能混过去。我去年就见过有人直接把GitHub上的开源项目扔给AI改了几行就提交,结果原作者刚好也申请了同款软著,两边重复率超过80%,不仅软著没申请下来,还被对方发了律师函,得不偿失。要是实在不知道怎么改才符合要求,可以去软著申请指南里找别人过审的案例参考下,照着人家的修改逻辑走,基本不会出大问题。
说白了,软著申请本来就是保护你自己的知识产权,哪怕你全程手写,代码抄的别人的,照样会被查出来;哪怕你全程用AI辅助,核心的功能、逻辑都是你自己的,改完之后完全符合原创要求,根本不用担心被查。我这两年报的20多件软著,一半以上都用到了AI辅助写代码、写文档,到现在没有一件出问题的,找对方法比瞎担心有用多了。