Datacon 2024 supply chain write up for QAQ
尝试1
首先看了今年复旦刚发的论文,主要分为三步,特征提取、顺序建模、bert 微调。由于没有公布源码,且没有黑白数据集,因此写了基于 pypi 包的特征提取与顺序建模器。但是后续考虑了三个因素,放弃了这个尝试。
- 因素1:论文效果不稳定,论文只指出能发现新的恶意包,并没有在大规模数据集上进行尝试,召回率与准确率无法保证。
- 因素2:特征提取与顺序建模器跑得太慢,优化后仍不理想。
- 因素3:没有太多 pypi 的恶意数据集,获得了 Backstabber 数据集。
阅读此文
Here's something encrypted, password is required to continue reading.
阅读此文
Here's something encrypted, password is required to continue reading.
阅读此文
Here's something encrypted, password is required to continue reading.
阅读此文
Here's something encrypted, password is required to continue reading.
阅读此文