Czy rozpoczynanie nazw od cyfr jest złą konwencją nazewnictwa danych?

17

Moja firma korzysta z ArcGIS i stosuje standardy nazewnictwa projektów i plików danych i (przeważnie) przestrzegane. Coś, co zawsze martwiło mnie w standardach nazewnictwa, polega na tym, że nakazuje rozpoczęcie wszystkich nazw projektów i plików danych od numeru projektu - ośmiocyfrowej liczby . Zawsze wierzyłem, że nazywanie plików GIS zaczynającymi się od liczb jest złą rzeczą i miałem (szczególnie w przypadku GRIDS) procesy zakończone niepowodzeniem z powodu nazwy pliku.

Chcę zmienić standardy korporacyjne, aby zrezygnować z wymogu dotyczącego numeru projektu, jednak nie mogę znaleźć wiele w dokumentacji, dlaczego „liczby jako pierwszy znak” w nazwie pliku są złe.

Czy ktoś może skierować mnie we właściwym kierunku, jeśli chodzi o zasoby na poparcie tego argumentu?

hgil
źródło
Zrobię trochę kopania dokumentacji, ale ogólnie liczby jako pierwszy znak w nazwach tabel db i strukturach folderów są złym pomysłem, jeśli nie są całkowicie nielegalne (nieprawidłowe). wiele narzędzi również się do tego stosuje. to właśnie wcześniej. gis.stackexchange.com/questions/3571/…
Brad Nesom
2
@ Witamy na stronie! Ponieważ doskonale sformułowałeś swoje pytanie, pozwoliłem sobie na usunięcie pierwszego akapitu, aby czytelnicy mogli od razu odpowiedzieć na twoje pytanie.
whuber
1
Liczby w nazwach plików nie stanowią problemu, ale nie można zaczynać nazw klas obiektów liczbami: gis.stackexchange.com/questions/6686/...
Derek Swingley

Odpowiedzi:

10

Ta konwencja po prostu błaga o usunięcie błędów od złych interpretatorów poleceń . (Zbyt łatwo jest pomylić początkowe cyfry z liczbą).

Sukces Twojego oprogramowania w unikaniu takich błędów nie gwarantuje, że nie pojawią się one w przyszłych wydaniach. Działo się to wiele razy, w ciągu dziesięcioleci, z oprogramowaniem GIS firmy ESRI. To zachowanie zostało szeroko zgłoszone i obszernie udokumentowane. Nie musisz szukać dalej niż fora użytkowników ESRI, które sięgają dekady. (Głębsze wyszukiwania starych archiwów listserver zabiorą cię jeszcze wcześniej, do około 1995 r.) Ciekawe wyszukiwania w Google obejmują

Strona „GRD ERROR”: forums.esri.com

nazwa pliku 8.3 strona: forums.esri.com

Razem dostarczą one około stu faktycznych przykładów problemów, jakie takie nazwy plików spowodowały i potencjalnie mogą spowodować ponownie.

Whuber
źródło
1
Co rozumiesz przez złe interpretatory poleceń?
Nathanus
2
@Nathanus Każdy z interfejsów „kalkulatora rastrowego”, jakie kiedykolwiek wydano dla ArcGIS 8.xi 9.x. Kolejny przykład: wewnętrzny interpreter silnika GRID, który był rdzeniem wszystkich analiz rastrowych w całym oprogramowaniu ESRI przez ćwierć wieku, jeszcze kilka lat temu. Również (w niewielkim stopniu) interpreter Avenue w ArcView 2.xi 3.x. Wszystkie te w niektórych kluczowych miejscach nie potrafią poprawnie przeanalizować języka wejściowego.
whuber
@ whuber .. Dzięki. w połączeniu z referencyjnym spadkiem Mapperz JET, otrzymałem świetne bloki konstrukcyjne / przykłady dla nadziei na zmianę standardów.
hgil
O. Miałeś na myśli konwencję odnoszącą się do ich obecnej praktyki, a nie konwencję nazewnictwa. Myliłem się trochę na tym.
Nathanus
9

Unikaj liczb, jeśli możesz -

Nauki o Ziemi mają dobry przykład http://library.oceanteacher.org/OTMediawiki/index.php/General_File-Naming_Convention_for_Earth_Science_Datasets#Filename_Sections_in_the_Order_They_Should_Appear

Spacje mogą cię potknąć - niektóre stare polecenia oparte na DOS do przenoszenia plików psują się, jeśli zajmuje miejsce - użycie „_” (podkreślenia) to mądra myśl - wynika to ze stacji roboczej ArcInfo - tylko 8,3 (8 znaków i format pliku) . W dzisiejszych czasach możesz mieć ich więcej - ale spraw, aby były czytelne dla ludzi. unikaj dat (większość plików ma znacznik czasu)

* Zasadniczo przejdź do tej instrukcji Przykład:

Reguły konwencji nazewnictwa, kierowane przez silnik Microsoft JET, który umożliwia aplikacjom Windows, takim jak ArcMap, odczytywanie różnych formatów tabel, obejmują:

  • Nazwa musi zaczynać się od litery, a nie cyfry.
  • Nazwa nie może zawierać spacji.
  • Jedynym dozwolonym znakiem specjalnym jest podkreślenie.

ArcMap

wprowadź opis zdjęcia tutaj

Mapperz
źródło
4

Każde okno dialogowe „Otwórz” lub „Wybierz” przeprowadzi sortowanie, zakładając, że pliki są nazwane literami. Więc jeśli używasz ośmiocyfrowego (!) Cyfrowego unikalnego numeru dla każdego projektu, sortowanie plików szybko stanie się nielogiczne. Na przykład

1
10
2
20
3 etc. 

Poza tym będzie wiele narzędzi GIS, które nadal będą przyjmować pliki zgodne z formatem plików MS DOS 8.3 .

Używanie samych nazw plików jako klucza do projektu wydaje się co najwyżej uciążliwe. O wiele lepiej byłoby przechowywać wszystkie pliki w jakiejś kontroli wersji w odpowiednich repozytoriach projektów.

geografia
źródło
Zgadzam się. To jeden z powodów, dla których próbuję zmienić istniejący standard. Nie tylko uciążliwe, ale w naszym przypadku również zbędne, ponieważ numer projektu znajduje się w innej części ogólnej ścieżki pliku.
hgil
+1 Dobra uwaga na temat sortowania i miła sugestia dla alternatywy. (Są jednak szanse, że ta konwencja wymusi pojawienie się zer początkowych, więc sortowanie i tak może działać ...).
whuber
2

Wydaje się, że nie ma ograniczeń dla pierwszej litery jako konwencji, z wyjątkiem konwencji NPS.

Nazwy plików i tabel atrybutów
A. Produkty końcowe GIS - Pokrycia, pliki kształtów i inne formaty muszą być zgodne ze strukturą nazewnictwa plików w wersji 10.3 (to znaczy cxxxxxxxxx.ext, gdzie „c” jest znakiem alfanumerycznym, a „x” jest alfanumeryczny, dla łącznie 13 znaków i jeden kropka oddzielająca nazwę pliku od rozszerzenia). Do generowania nazw plików należy stosować następujące konwencje: ccccccc99c.ext
i. 4-znakowy prefiks dla kodu parkowania (patrz Tabela 1).
ii. 5-znakowy kod projektu, jak wskazano w bazie danych śledzenia projektu NCCN. Patrz Informacje o projekcie śledzenia NCCN (NCCN 2005b, w opracowaniu).
iii. Pojedynczy znak odróżniający warstwy GIS w ramach tego samego projektu. Ten pojedynczy znak jest nazywany kodem produktu projektu GIS i jest przechowywany w bazie danych śledzenia projektu NCCN. Powinien to być znak alfanumeryczny wybrany w sekwencji (tj. Zaczynać od a, b, c itd.), Ponieważ więcej warstw GIS jest tworzonych lub dodawanych do projektu. Na przykład, zakładając, że istnieją już dwie inne warstwy GIS dla tego projektu, plik eksportu ESRI Arc / Info projektu NOCA Landbird Inventory w punktach początkowych transect miałby nazwę pliku „nocabda02c.e00.”
Iv. Rozszerzenie Plik kształtu ESRI składałby się z co najmniej pięciu plików o tej samej nazwie i następujących rozszerzeniach: .shp, .shx, .dbf, .shp, shp.xml i .prj. <<

Przepraszam za powyższy akapit.
Z mojego doświadczenia wynika, że ​​gdy istnieje konwencja nazewnictwa o niespełniających
normach , 1. ludzie ją łamią z powodu trudności w przestrzeganiu.
2. ludzie łamią go, aby przestrzegać innych standardowych konwencji nazewnictwa.

Faktem jest, że istnieją narzędzia, które nie pozwalają na numeryczne nazwy pierwszego znaku i nazwy pól, a nazewnictwo RDBMS prawie zawsze przestrzega tych samych reguł.

Dokumentacja Indiana Dokumentacja
Oregon Dokumentacja
Jason Birch Dokumentacja
Nat Park Serv
Bezpieczeństwo publiczne Dokumentacja wielu agencji
Kody rzek wydają się ignorować najlepsze praktyki
Dokumentacja San Antonio
Więcej dokumentacji NPS

Brad Nesom
źródło