u8,u8国际,u8国际官方网站,u8国际网站,u8国际网址,u8国际链接,u8体育,u8体育官网,u8体育网址,u8注册,u8体育网址,u8官方网站,u8体育APP,u8体育登录,u8体育入口
哈希实验报告 一、 问题描述 1. 实验题目: 利用哈希表统计两源程序的相似性 2. 基本要求: 1) 内容: 对于两个 C 语言的源程序清单, 用哈希表的方法分别统计两程序中使用 C语言关键字的情况, 并最终按定量的计算结果, 得出两份源程序的相似性。 2) 要求与提示: C 语言关键字的哈希表可以自建, 也可以采用下面的哈希函数作为参考: Hash(key) =(key 第一个字符序号*100+key 最后一个字符序号) %41 表长 m 取 43。 此题的工作主要是扫描给定的源程序, 累计在每个源程序中 C 语言关键字出现的频度。 为保证查找效率, 建议自建哈希表的平均查找长度不...
哈希实验报告 一、 问题描述 1. 实验题目: 利用哈希表统计两源程序的相似性 2. 基本要求: 1) 内容: 对于两个 C 语言的源程序清单, 用哈希表的方法分别统计两程序中使用 C语言关键字的情况, 并最终按定量的计算结果, 得出两份源程序的相似性。 2) 要求与提示: C 语言关键字的哈希表可以自建, 也可以采用下面的哈希函数作为参考: Hash(key) =(key 第一个字符序号*100+key 最后一个字符序号) %41 表长 m 取 43。 此题的工作主要是扫描给定的源程序, 累计在每个源程序中 C 语言关键字出现的频度。 为保证查找效率, 建议自建哈希表的平均查找长度不大于 2。 扫描两个源程序所统计的所有关键字不同频度, 可以得到两个向量。 如下面简单的例子所示: 根据程序 1 和程序 2 中关键字出现的频度, 可提取到两个程序的特征向量 X1 和 X2, 其中 X1=(4 3 0 4 3 0 7 0 0 2) X2=(4 2 0 5 4 0 5 2 0 1) 一般情况下, 可以通过计算向量 Xi 和 Xj 的相似值来判断对应两个程序的相似性, 相似值的判别函数计算公式为: S(Xi, Xj) Xi T TT XiX