Od lat pracuję z danymi. Dla różnych firm, od największych (banki, telekomy) po mniejsze (ecomm, marketing). Zasadniczo wszystkie z nich sprzedają. Wszystkie dla klientów indywidualnych. I obecnie wszystkie już online.
We wszystkich firmach zderzałem się z jakością danych otrzymanych od klientów – jest normą że różne osoby mieszkające w Rucianem-Nidzie, przy Alei Wczasów, podadzą swój adres różnie: czasami jako 'Ruciane-Nida, Aleja Wczasów’, czasami 'Ruciane, Wczasów’. Do tego dochodzą wszelkie wariacje takiego adresu. Wszelkie dane adresowe trafiają do baz, gdzie – w idealnym świecie – nie powinnien istnieć adres jednego miejsca zapisany różnymi sposobami.
Tam gdzie mi się to udawało 🙂 moi klienci pobierają dane od swoich klientów w taki sposób, że powyżej opisany problem występuje możliwie rzadko – jeżeli klienci podają swoje dane adresowe przez formularze internetowe, adres do wpisania jest 'podpowiadany’ klientowi. Jeżeli klient dzwoni na infolinię – jego dane wpisuje do formularzy konsultant, a w takim wypadku adres w formularzu jest 'podpowiadany’ konsultantowi. Klient po wpisaniu kodu pocztowego otrzymuje listę możliwych miast do wyboru, po wybraniu miasta otrzymuje listę możliwych do wybrania ulic. Pomijając znacznie zwiększone prawdopodobieństwo że dane pobrane od klienta będą jednolite – tak dla kolejnych jego zamówień jak i z formatem danych adresowych innych klientów z danej okolicy, bardzo istotna może być możliwość łatwiejszego dopasowania klienta robiącego przykładowe zamówienie, z klientem już istniejącym w naszej bazie – czyli jego historią, jakością, potencjalnymi problemami.
Największym problemem, szczególnie dla firm niewielkich, jest pozyskanie bazy polskich adresów pocztowych. Powszechnie dostępny SPN Poczty Polskiej jest stary, ponadto warunki jego użycia wykluczają zastosowanie jak wyżej. Dane możliwe do pozyskania np. z google’a via API są drogie, a ich rozliczanie może się zakończyć niespodziankami. Jednorazowy zakup bazy adresów od największej w Polsce firmy zajmującej się takimi usługami to kilkanaście tysięcy PLN. Mając na uwadze powyższe ograniczenia przygotowałem własną bazę, bazując na dostępnych otwartych źródłach takiej informacji (więcej tutaj), regularnie ją uaktualniam i żal byłoby jej nie oferować na bardziej korzystnych warunkach 🙂 .