Нечеткое сопоставление (также называемое приблизительным сопоставлением строк) - это техника, которая помогает идентифицировать два элемента текста, строк или записей, которые приблизительно похожи, но не являются полностью одинаковыми.
Почему нечеткое соответствие?
Нечеткое сопоставление - это техника, используемая в компьютерном переводе как частный случай связывания записей. Он работает с совпадениями, которые могут быть менее чем на 100% идеальными при поиске соответствий между сегментами текста и записями в базе данных предыдущих переводов.
Как использовать нечеткое соответствие?
Выберите Использовать нечеткое сопоставление для выполнения слияния, выберите Параметры нечеткого сопоставления, а затем выберите один из следующих параметров:
- Порог сходства Указывает, насколько похожими должны быть два значения, чтобы они совпадали. …
- Игнорировать регистр Указывает, следует ли сравнивать текстовые значения с учетом или без учета регистра.
Как я могу улучшить нечеткое соответствие?
Вот несколько способов использования нечеткого сопоставления для улучшения итоговых результатов:
- Реализуйте единое представление клиента.
- Работайте с чистыми данными, которым можно доверять.
- Подготовка данных для бизнес-аналитики.
- Повысьте точность ваших данных для повышения эффективности работы.
- Обогатите данные для более глубокого понимания.
- Обеспечение лучшего соответствия.
Что такое нечеткое совпадение в MDM?
Стратегия сопоставления/поиска, использующая вероятностное сопоставление, учитывающаявариации правописания, возможные орфографические ошибки и другие различия, которые могут сделать совпадающие записи неидентичными. Если выбрано, Informatica MDM Hub добавляет специальный столбец (ключ нечеткого соответствия) к базовому объекту.