Информацията е неизчерпаема и като един океан, в който може да се „удавиш“, докато се опитваш да преплуваш от точка А до точка Б. Много хора и компании вярват, че сами трябва да събират данните, които са им необходими, за да извършват анализите си и да се възползват от предимствата на „голямата информация”. Но това е просто едно погрешно схващане, продиктувано от индивидуализма на човека било то изследовател, или изпълнителен директор.
В публичното пространство съществуват стотици, ако не и хиляди източници на данни, които са безплатни, събирани и компилирани по международни стандарти и чакат да бъдат използвани от всеки, които има желание за това. Разбира се, когато търсим данни трябва да бъдем много внимателни и критично настроени дали достъпните бази от данни са достатъчно достоверни, актуални и дали се използват като официално признати източници на информация.
Следващият списък представлява някои от най-популярните и достоверни източници на данни в глобален мащаб.
data.gov. През 2015 г. американското правителство направи обещание да направи цялата правителствена информация публична и със свободен достъп. Този сайт е само първата крачка към изпълнението на обещанието. В него може да търсите сред над 200 000 бази данни от престъпността до климатичните промени.
opendata.government.bg. Това би трябвало да е еквивалента на горния сайт. За съжаление, все още има много да се работи по него като структура и организация на данните.
open-data.europa.eu. Същият портал като горните два, само че на ниво ЕС.
data.gov.uk. Това е порталът за свободни данни на Великобритания, в който може да намерите дори описание на всички книги и публикации направени на острова след 1950 г. Част от данните вече могат да бъдат извличани и чрез API, а на портала ще може да търсите сред 390 приложения (Apps), които ви дават различна информация и възможност сами да правите анализи.
census.gov. Американското бюро по преброяването от много години поддържа на сайта си богати бази данни по различни социално-икономически и демографски показатели за населението на САЩ.
nsi.bg. Националният статистически институт на България е институцията, която официално е призната за достоверен и е един от официално признатите източници на данни в страната.
Регионални профили. Амбициозен проект, които се развива във времето и всяко следващо издание се стреми да представи повече информация по категории за българските области. Използваните данни могат да бъдат свободно изтеглени и да извършвате ваши собствени анализи.
Eurostat. Евростат пък е мястото, от което може да намерите повече статистически данни на Европейския съюз. Информацията е групирана по теми, а за бързи справки може да използвате вградените инструменти за визуализация на сайта.
opengovernmentdata.org. Този сайт има амбицията да предложи най-пълния списък от сайтове с данни в света. Дали ще успее, само времето ще покаже. Но засега в него са поместени 519 портала с данни. Хубавото е, че има карта, чрез която да видите дали за търсената от вас държава има портал със свободни данни.
The CIA World Factbook. Кой студент по урбанизъм или друга специалност, боравеща с данни, не е попадал поне 1 път тук? Това е официалната страница с данни на ЦРУ, в която може да намерите основна информация за почти всички държави по света. Не очаквайте, обаче да намерите някоя тайна информация.
UNICEF. Тук може да намерите статистически данни за повечето държави по света, най-вече свързани с демографията, процесите, които имат отношение към децата, жените и базовата инфраструктура във всяка страна. Трябва да се има предвид, че някои данни са малко остарели.
СЗО (Световна здравна организация).Сайтът предлага данни, доклади и схеми, свързани със здравословното състояние на световното население, както и факторите, които му оказват влияние. Базите от данни се обновяват редовно и са по единен стандарт, което прави лесно сравняването на страните по отделни показатели.
Facebook. Да, Фейсбук. Въпреки, че голяма част от информацията, която потребители споделят е скрита, има и много публична такава. Използвайки Graph API можете да извлечете много обобщени данни за хората, използващи социалната мрежа.
Google Public Data. Google също предоставя възможност да търсите информация в официалните източници на данни. Така няма да се „загубите“ в „морето“ от информация, което ще получите от основната версия на търсачката.
Junar е облачно базирана платформа, която позволява бързото превръщане на данните, които имате в полезна информация за потребителите, до които искате да достигнете. Един минус – платена е.
Google Trends. Чудели ли сте се кое най-много се търси в Гугъл? Ето това е мястото откъдето може да разберете тенденциите в търсенето в Гугъл от 2004 г. до сега. Например, до септември 2004 г. някой не е търсил думата „урбанизъм“ в Гугъл, а сега всеки месец има поне 10 търсения.
themapdatabase.com.Почитателите на историческите карти определено ще намерят този сайт за много полезен. В него са събрани над 750 изображения на исторически карти, които са групирани по континенти и държави. А някои от тях са още от Римско време.
Free GIS data. Този сайт е резултатът от неуморните усилия на един запален географ – Робин Уилсън, който си е поставил за цел да събира, каталогизира и публикува намерените от него сайтове, съдържащи свободна за изтегляне пространствена информация – готова за използване в ГИС. Веднъж на няколко месеца информацията се осъвременява с нови източници.
Горните линкове са само една малка част от това, което може да намерите в Интернет. Вече голяма част от големите компании, сайтовете и приложенията предлагат API достъп до информацията, която те са събрали (а вие сте се съгласили да споделите).
Така че когато започвате някой нов проект или изследване, не е нужно тепърва да „откривате топлата вода“ и сами да си събирате данните. Проверете, някой преди вас може вече да го е направил и по-важното да иска да ги сподели без заплащане.
А кои са вашите източници на данни и от кои сайтове започвате да набирате информация, когато тя ви е необходима за нов проект? Ще се радвам да споделите като коментар по-долу.