Adresówki
Z UMP
d (→Historia: drobne stylu) |
d (→Nazewnictwo: poprawa stylu) |
||
Linia 13: | Linia 13: | ||
== Nazewnictwo == | == Nazewnictwo == | ||
- | Pewnie spotkałeś się z plikami gNazwaGminy-data.adr albo gNazwaGminy-PRG16.adr te nazwy mają znaczenie :) | + | Pewnie spotkałeś się z plikami gNazwaGminy-data.adr albo gNazwaGminy-PRG16.adr, te nazwy, jak się domyślasz, mają jakieś znaczenie :) |
- | W wyniku przemyśleń doszliśmy do pewnego schematu nazewniczego, ponieważ proces ten przebiegał w długim okresie to nadal można spotkać pełne spektrum. | + | W wyniku przemyśleń doszliśmy do pewnego schematu nazewniczego, ponieważ proces ten przebiegał w długim okresie to nadal można spotkać pełne spektrum "na wolności". |
- | schemat podstawowy wygląda | + | schemat podstawowy wygląda tak: |
mgNazwaGminy_data.adr | mgNazwaGminy_data.adr | ||
Linia 25: | Linia 25: | ||
* m - gmina miejska lub miasto na prawach powiatu (czytaj po prostu miasto) | * m - gmina miejska lub miasto na prawach powiatu (czytaj po prostu miasto) | ||
- | Potem | + | Potem nazwa gminy (a w paru miejscach dodajemy też nazwę powiatu) pisaną bez spacji i w tzw TilteCase |
Zwykle za nazwą gminy umieszczamy datę w formie rok-miesiąc (o np tak 2016-01), jednak w tym członie zachodziły największe zmiany. | Zwykle za nazwą gminy umieszczamy datę w formie rok-miesiąc (o np tak 2016-01), jednak w tym członie zachodziły największe zmiany. | ||
- | Dla danych pozyskiwanych od gmin wpisujemy rok-miesiąc. | + | Dla danych pozyskiwanych bezpośrednio od gmin wpisujemy rok-miesiąc. |
Dla kilku miast gdzie można pobrać dane samodzielnie, używamy pełnej daty tj (2016-01-01) | Dla kilku miast gdzie można pobrać dane samodzielnie, używamy pełnej daty tj (2016-01-01) | ||
- | Dla danych | + | Dla danych udostępnianych przez codgik używaliśmy kolejno: |
PRG1, PRG2 potem zmieniliśmy na PRG14C gdzie 14 to końcówka roku a C to kolejna literka nadawana przy pobraniu danych (doszliśmy do 15U). Ten schemat uchował się do końca roku 2015. | PRG1, PRG2 potem zmieniliśmy na PRG14C gdzie 14 to końcówka roku a C to kolejna literka nadawana przy pobraniu danych (doszliśmy do 15U). Ten schemat uchował się do końca roku 2015. | ||
Od początku 2016 r. używamy 2 zapisów: PRG16A gdzie literka oznacza kolejny miesiąc (dla danych wymagających dużej pracy ręcznej) oraz PRG16 bez literki dla czystych danych które można często uaktualniać. | Od początku 2016 r. używamy 2 zapisów: PRG16A gdzie literka oznacza kolejny miesiąc (dla danych wymagających dużej pracy ręcznej) oraz PRG16 bez literki dla czystych danych które można często uaktualniać. | ||
- | Od niedawna używamy zapisu 2016i dla danych udostępnionych przez gminy | + | Od niedawna (IX 2016) używamy również zapisu 2016i dla danych udostępnionych przez gminy w iMPA (literka "i" jest stała) te dane są zwykle obecne w PRG ale te bezpośrednio są świeższe (i zawierają więcej ciekawych dla nas danych) |
- | Można też spotkać pliki ADR-Obszar.adr to jest miejsce na własnoręcznie wstawione punkty. Acz lepiej postarać się o te gminne, niźli wstawiać je tu seryjnie. | + | Można też spotkać pliki ADR-Obszar.adr to jest miejsce na własnoręcznie wstawione punkty. Acz lepiej postarać się o te gminne, niźli wstawiać je tu seryjnie. I ten jako jedyny można edytować do woli (acz proszę o nie mikro-przesuwanie). |
== Historia == | == Historia == |
Wersja z dnia 12:43, 6 paź 2016
Pliki ADR
W katalogach źródłowych src możesz spotkać pliki z rozszerzeniem .adr, format wewnątrz jest bliźniaczo podobny do formatu PNT.
Uwaga, pliki są "prawie tylko do odczytu", podczas aktualizacji, dość często, plik jest kasowany i wgrywany jest nowy, bez zachowania dotychczasowych zmian. Przesuwanie tych punktów jest bardzo nie mile widziane, choć dopuszczamy inne poprawki, oraz wstawianie własnych, choć nadal trzeba się liczyć ze zniknięciem podczas aktualizacji.
Proszę też, nie dzielić plików na granicy obszarów, one mają "wystawać".
Jeśli chcesz działać w tej materii (pozyskiwanie, zmiany, uwagi, itp) skontaktuj się najpierw z Ar't-em bądź z Alf-em (a najlepiej mailować do nas zbiorczo). Mamy dość dopracowany mechanizm przetwarzania danych z gmin i z CODGIK.
Jeśli brakuje adresówek jakieś gminy też pisz do nas, postaramy się coś z tym zrobić.
Nazewnictwo
Pewnie spotkałeś się z plikami gNazwaGminy-data.adr albo gNazwaGminy-PRG16.adr, te nazwy, jak się domyślasz, mają jakieś znaczenie :)
W wyniku przemyśleń doszliśmy do pewnego schematu nazewniczego, ponieważ proces ten przebiegał w długim okresie to nadal można spotkać pełne spektrum "na wolności".
schemat podstawowy wygląda tak:
mgNazwaGminy_data.adr
na początku umieszczamy wyróżnik rodzaju gminy
- g - gmina wiejska
- mg - gmina miejsko-wiejska
- m - gmina miejska lub miasto na prawach powiatu (czytaj po prostu miasto)
Potem nazwa gminy (a w paru miejscach dodajemy też nazwę powiatu) pisaną bez spacji i w tzw TilteCase
Zwykle za nazwą gminy umieszczamy datę w formie rok-miesiąc (o np tak 2016-01), jednak w tym członie zachodziły największe zmiany.
Dla danych pozyskiwanych bezpośrednio od gmin wpisujemy rok-miesiąc.
Dla kilku miast gdzie można pobrać dane samodzielnie, używamy pełnej daty tj (2016-01-01)
Dla danych udostępnianych przez codgik używaliśmy kolejno: PRG1, PRG2 potem zmieniliśmy na PRG14C gdzie 14 to końcówka roku a C to kolejna literka nadawana przy pobraniu danych (doszliśmy do 15U). Ten schemat uchował się do końca roku 2015. Od początku 2016 r. używamy 2 zapisów: PRG16A gdzie literka oznacza kolejny miesiąc (dla danych wymagających dużej pracy ręcznej) oraz PRG16 bez literki dla czystych danych które można często uaktualniać.
Od niedawna (IX 2016) używamy również zapisu 2016i dla danych udostępnionych przez gminy w iMPA (literka "i" jest stała) te dane są zwykle obecne w PRG ale te bezpośrednio są świeższe (i zawierają więcej ciekawych dla nas danych)
Można też spotkać pliki ADR-Obszar.adr to jest miejsce na własnoręcznie wstawione punkty. Acz lepiej postarać się o te gminne, niźli wstawiać je tu seryjnie. I ten jako jedyny można edytować do woli (acz proszę o nie mikro-przesuwanie).
Historia
Na początku 2014 r. wpadliśmy (Ar't i Wojtek) na pomysł by pozyskiwać z urzędów punkty adresowe, po małych perturbacjach dorobiliśmy się dość uniwersalnego konwertera danych (o ile dane dają się w jakiś sposób parsować i nie są tajnymi blobami binarnymi) używanego do dziś.
Do zespołu "adresowego" dość aktywnie włączył się jeszcze Alf. Parę osób nam pomaga od czasu do czasu.
Pewnego dnia (2014-07-10) codgik zrobił niespodziankę, udostępnił dane z własnych zasobów (acz warto wspomnieć że był zmuszony do tego wyrokiem sądu). I wszystko było by fajnie gdyby nie jakość tych danych, która wahała się od dobrej do bardzo złej (z przewagą tych ostatnich). Ale to nie koniec, dane te są udostępnione wg podziału administracyjnego na poziomie województw, a to oznacza plik XML dla mazowieckiego wielkości powyżej 2GB inne mniej ale w granicach 1GB, dodatkowo struktura wewnętrzna potrzebuje skakać po całym pliku by go jakość sensownie przetworzyć. Stąd decyzja podziału na gminy pozwalająca to powoli ogarniać. Pomimo dostępnych danych, sporo gmin warto nadal odpytywać, gdyż zwykle dostajemy wtedy dane lepsze/poprawione (zdarzają się być poprawiane na nasze wskazanie).
I tak to się kręci.