维普降重指南
概述
目前来看这鬼系统就是把段落中的关键字及其顺序提取出来,如果重复得多了就判定你重复, 它才不管这两句话实际上意思差别很大。
所以说降重方法就是把重复的句子直接删掉,啊不是,是避免出现和它给的相似片段中相同的关键字组合和顺序。
具体来说可以考虑:
- 用代词替换掉关键字。
- 调整句子顺序。
最后吐槽一下 18000 字的论文识别成 26000 字,真 TM 坑。
Links: f**k-weipu
目前来看这鬼系统就是把段落中的关键字及其顺序提取出来,如果重复得多了就判定你重复, 它才不管这两句话实际上意思差别很大。
所以说降重方法就是把重复的句子直接删掉,啊不是,是避免出现和它给的相似片段中相同的关键字组合和顺序。
具体来说可以考虑:
最后吐槽一下 18000 字的论文识别成 26000 字,真 TM 坑。
Links: f**k-weipu