前两年帮公司做软著申报,连着三次被打回,两次死在源代码格式上。第一次是每页行数不够,空行占了小半页,第二次是代码里混了之前引用的开源组件的版权声明,第三次好不容易格式对了,结果前15页和后15页的页码没接上,又打回来重弄。那半个月我每天下班都留在公司调格式,几千行代码一行行删空行、改注释,改到眼都花了,当时就想着要是有什么办法能一键搞定这个破格式就好了。
先说说我之前踩过的格式坑
很多第一次申报软著的人不知道,版权局对源代码的要求其实特别细,不是随便把代码导出来凑够30页就行。首先每页至少要有50行有效代码,空行、单独的注释行都不算数,行间距、字号都有隐性要求,太松的话一页行数不够直接被打回。然后页眉必须统一标软件名称加版本号,右上角是连续的页码,不能前半段一个页码规则,后半段另一个。还有注释占比不能超过30%,更不能出现第三方的版权声明、开源协议标识,哪怕你只是引用了一个小工具的代码,留了个MIT的字样,都可能被判定为非自主开发,直接驳回。
我之前最烦的就是凑30页的要求,代码太多的话要摘前1500行和后1500行,手动摘的话很容易摘错,要么把无关的测试代码摘进去,要么核心逻辑没放全。代码太少的话还要调整格式,确保每页行数够,不会因为页数不够被要求补材料。直到后来和做知识产权的朋友吃饭,他说现在行业里早就开始用AI格式化软著源代码了,大部分代理处理源代码的时间从原来的两三天缩到十几分钟,基本不会出格式问题。
我当时半信半疑回去试了好几个工具,还有通用大模型,踩了几个小坑之后终于摸顺了流程。哦对了你们要是嫌写prompt麻烦,也不想自己核对要求,顺手给你们推荐个我用了快一年的工具软著Pro,它是专门做软著材料处理的,格式化出来的源代码我提交了十几次从来没在格式上出过问题,连页眉的软件名版本号都会自动匹配你填的信息,省了好多核对的时间。
用AI格式化的具体操作逻辑
要是你想用通用大模型自己弄也可以,核心是要把要求给得足够细,不要只说“帮我格式化软著源代码”,AI根本不知道要按什么标准来。我平时用的prompt你们可以直接套:先说明是按中国版权局软著申报的要求处理,然后列清楚规则:删除所有空行和无关的调试注释,注释占比控制在20%以内,不要动代码本身的逻辑;逐行排查所有内容,删掉包含第三方版权声明、开源协议标识、其他公司名称的内容,要是整个文件都是第三方依赖的代码直接剔除;调整字号为小五号,行间距1.0倍,确保每页有效代码不少于50行;统一添加页眉,左侧是软件全称加版本号,右侧是连续页码,从1开始排序;如果总代码量超过30页,就取前15页和后15页,页码连续不要断开。
把prompt输进去之后再上传你导出的源代码就行,注意不要把node_modules、测试脚本这些无关的内容导进去,就挑你自己写的核心业务代码,比如你做的是电商系统,就取商品、订单、用户模块的代码就行,乱七八糟的依赖代码混进去反而容易出问题。要是代码涉及涉密内容,就不要用公共大模型了,用本地部署的工具更安全,我之前处理公司内部系统的软著,都是用软著源代码格式化的本地处理功能,代码不会上传到服务器,完全不用担心泄露的问题。
这些坑一定要提前避开
我之前帮同事弄软著的时候,就遇到过AI自动改代码逻辑的问题,他没在prompt里说不要改代码,大模型自动把他写的冗余代码优化了,结果提交的代码和实际运行的代码对不上,后来维权的时候差点出问题。所以一定要在要求里明确说,只能调整格式和删除不符合要求的内容,绝对不能修改代码的逻辑和有效内容。
还有很多人会忽略格式要求的更新,版权局的要求偶尔会有小调整,比如去年下半年就改了源代码的每页最低行数要求,很多人还在用几年前的旧标准,弄完提交直接被打回。要是你不知道具体的格式要求是什么样的,可以去软著申报材料规范页面查最新的要求,都是同步版权局的最新规则,不用自己到处找。
上个月我帮朋友的创业公司申报三个软著,要是以前手动弄的话,至少要花三天时间,每天熬到半夜,这次我直接把导出来的核心代码扔进去,半个多小时就全部弄好了,提交之后一周就下了受理通知书,一点问题都没有。朋友本来还留了半个月的时间改材料,结果直接提前搞定,刚好赶上他们申请高新企业的截止时间,省了好多麻烦。
我身边现在做技术的朋友要申报软著,我都让他们先试试AI格式化的方法,真的不用跟以前一样死磕格式,省下来的时间多写两行功能代码不好吗?当然你要是第一次弄怕出错,也可以找专业的代理帮忙,不过核心的源代码格式化这步,用AI真的能省超多事,试过就知道有多香。