我有两个优等生。两者都有公司名称和国家数据。但公司名称相似,并不相同。因此,使用国家数据(这是相同的),我必须匹配公司名称并在一个excel文件中显示最终匹配的数据。我还附上了两个excel中的数据示例。我用颜色标记了它们,这样它们就可以被理解为相似的公司名称(Cat INC = Cat LLP)。我创建了一个使用像replace这样的操作符的模型(有很多手工工作,比如输入可替换的值)。此外,实际数据文件由其中的1000行组成。因此,如果有人可以建议一个模型类型,可以比较和匹配2个文件之间的数据,这将是有帮助的。
答案
您是否安装了工具箱扩展来尝试新的“模糊匹配”操作符?它将使用流行的Levenshtein距离或任何其他变化距离度量来合并两个表,并进行模糊匹配。它将根据您的需要显示多个候选匹配项。
您可以在模糊匹配之后应用过滤器,以确保县名完全相同。
示例流程如下
欢呼,
YY
我有两个优等生。都有公司名称和国家名称。但公司名称相似,并不相同。我必须匹配公司名称(即使名称中的一个单词是匹配的,例如:猫公司和猫LLP)并将最终匹配的数据显示在一个excel文件中,如下(3)所示。我还附上了两个excel(1&2)的数据示例。我用颜色标记了它们,这样它们就可以被理解为相似的公司名称(Cat INC = Cat LLP)。此外,实际数据文件由其中的1000行组成。因此,如果有人可以建议一个模型类型,可以比较和匹配2个文件之间的数据,这将是有帮助的。
你可以从“读取Excel”中加载数据并尝试一下
输出是这样的
HTH !
YY