Wiele razy, gdy próbujemy wymyślić skuteczny projekt bazy danych, najlepszym rozwiązaniem jest zbudowanie dwóch przykładowych baz danych, wypełnienie ich danymi i uruchomienie kilku zapytań, aby sprawdzić, która z nich działa lepiej.
Czy istnieje narzędzie, które stosunkowo szybko wygeneruje (najlepiej bezpośrednio do bazy danych) duże (~ 10 000 rekordów) zestawy danych testowych? Szukam czegoś, co przynajmniej działa z MySQL.
Zwykle generuję własne, używając niektórych znanych danych jako danych wejściowych - jeśli są zbyt przypadkowe, nie zawsze jest to dobry test; Potrzebuję danych, które będą dystrybuowane podobnie do mojego produktu końcowego.
Wszystkie większe bazy danych, które muszę dostroić, mają charakter naukowy - dlatego zwykle mogę wziąć inne dane jako dane wejściowe, przeskalować je i dodać jitter. (np. biorąc dane z pięciominutową kadencją z milisekundową precyzją i przekształcając je w 10-sekundową kadencję z precyzją milisekundową, ale jitter +/- 100 ms do czasów)
...
Ale jako kolejna alternatywa, jeśli nie chcesz pisać własnych, to przyjrzeć się niektórym narzędziom do analizy porównawczej - ponieważ mogą one powtarzać rzeczy w kółko na podstawie zestawu szkoleniowego, możesz ich używać do wstawiania partii rekordów (a następnie po prostu zignoruj raporty o tym, jak szybko to zrobiło) ... a następnie możesz użyć tego samego narzędzia do testowania szybkości działania bazy danych po zapełnieniu.
źródło
Korzystałem z mysqlslap. Oczyszcza się także po sobie.
Oto artykuł, który przeczytałem, kiedy zacząłem go używać.
źródło
Spójrz na benerator
Na początku nie jest łatwo, ale jest dość potężny.
źródło
Spójrz na tę funkcję. Możesz generować nazwy, numery telefonów, kody pocztowe itp. Jest to całkowicie zrobione w MYSQL bez potrzeby innych aplikacji. http://moinne.com/blog/ronald/mysql/howto-generate-meaningful-test-data-using-a-mysql-function
źródło
Najbardziej opłacalnym sposobem jest prawdopodobnie użycie generatora danych typu open source lub komercyjnego. Kiedyś to robiłem.
Teraz, w moich złotych latach, każdą potrzebę danych testowych traktuję jako mandat do nauki innego języka skryptowego.
źródło
Dla każdego, kto szuka innego rozwiązania tego problemu ... Napisałem testowy projekt generatora danych dla Data Synchronization Studio. Może generować duży zestaw danych, od 1 do 100 milionów wierszy realistycznych danych testowych. Oto post na blogu na ten temat. http://www.simego.com/Blog/2012/02/Test-Data-Generator-Download-for-Data-Sync Korzystanie z niego jest bezpłatne przez 15 dni (po uzyskaniu danych testowych, masz je)
źródło