ID |
1023 |
Exportovat do otisku |
Ano |
Název trendu |
Data mining sociálních sítí |
Anglický název trendu |
Social Network Data Mining |
Typ trendu |
Rozvojový program |
Kategorie první úrovně |
Technologický pokrok |
Kategorie druhé úrovně |
Manažerský charakter |
Způsobilost pro NIPI |
Trend úzce spojený s Big Data a dalšími uvedenými trendy. Je zde zaměření na data mining velkého objemu prostorových informací zejména lidí – jejich pohybů a socioekonomických/demografických prostorových dat a informací.
Data mining slouží primárně pro odvozování sekundární prostorových dat a informací, elektronickému automatizovanému zpracování. Jsou provázána rovněž například s daty mobilních operátorů, nebo floating car data.
Ačkoliv podléhají tato data anonymizování a omezením (například ze strany GDPR), je možné sledovat společné prvky v pohybu obyvatel, jejich činnostech, chování atd. (například při volbách, lokální či globální migraci, turismu atd.). Tyto společné prvky umožňují rozšiřovat prosté prostorové informace o další přidané hodnoty.
Proces těžení využívá API, potažmo REST API, či zabudované knihovny (například v jazyku Python) jednotlivých sociálních sítí. |
Zkrácený popis trendu |
Rozsáhlé posloupnosti – proudy prostorových i neprostorových dat a informací, které jsou vytěžovány za účelem získání sekundárních informací o uživatelích sociálních sítí, v generalizované podobě. |
Popis trendu |
Sociální sítě poskytovaly v minulosti velmi otevřená API, díky kterým bylo možné zpracovávat systematicky dlouhé rozsáhlé proudy dat různých sociálních sítí (Facebook, Twitter, LinkedIn, Instagram atd.). Data a informace uživatelů podléhají v současné době čím dál větší ochraně osobních údajů. To má za následek nutnost čím dál větší anonymizace dat a informací a také zkreslování množiny vytěžovaných dat.
V sociálních sítích existují struktury lidí, kteří jsou propojeni přímo či nepřímo ve vztazích, nebo společných zájmech. Tato propojení jsou zkoumána analýzou vytěžovaných dat sociálních sítí, hledáním zmíněných struktur, chování a způsobů propojení lidí. Významné jsou v tomto případě rovněž spjaté prostorové informace – souřadnice a pohyb lidí v prostoru, spojený právě se společnými zájmy (egocentrické VS sociocentrické sociální sítě). Přidané informace lidí propojují humanitní obory s technickými. Tyto informace se dají rozdělit dle reálných a domnělých informací na (1):
• Sociální sítě „kdo zná koho“.
• Socio-kognitivní sítě „kdo si myslí, že zná někoho“.
• Znalostní sítě „kdo zná co“.
• Znalostně – kognitivní sítě „kdo si myslí, že zná co“.
Počítačové sítě jsou ve své podstatě inherentní k sociálním sítím, propojováním lidí, organizací vědomostí (3). Nárůst výpočetního výkonu umožňuje zpracovávání Big Data a zrychluje Data mining těchto prostorových informací. V oblasti sociálních sítí je nejčastěji zmiňován Data mining sítě Twitter, ačkoliv je množina Data miningu sociálních sítí mnohem širší, počínaje emailovou komunikací (Email Web Logs), zdravotní data, přes tzv. MMORPG online počítačové hry až po vyhledávací web služby.
Data mining využívají několika základních technik: vyhledávání anomálií, detekce společných prvků – asociací, shlukování, klasifikace, regrese a v neposlední řadě predikce atd. (Fayyad et al., 1996).
Predikce chování lidí hraje v případě sociálních sítí významnou roli, jelikož slouží jako nástroj predikce sociálních fenoménů, veřejných událostí, mechanických pohybů atd. |
Časový horizont |
Do 2 let |
Časový horizont, popis |
Již dlouhodobě užívaný způsob Data mining a získávání sekundárních informací a dat, zejména v zahraničí. Významný vliv na statická i dynamická prostorová a socioekonomická/demografická data a informace v GIS, rovněž obecně v IT a sociologii. |
Omezení |
Nebezpečí postupného omezování přístupů provozovatelů sociálních sítí k datům a informacím |
Zdroje informací |
1) Contractor, N., Wasserman, S., Faust, K., 2006. Testing Multi-theoreticalMultilevelHypothesesAboutOrganizationalNetworks: An Analytic Framework and EmpiricalExample. Academyof Management Review. 31. 681-703. 10.5465/AMR.2006.21318925.
2) Fayyad, U., Piatetsky-Shapiro, G., Smyth, P., 1996. From Data Mining to Knowledge Discovery in Databases. AI Magazine. 17. 37-54. 10.1609/aimag.v17i3.1230.
3) Wellman, B.,(2001. Physical Place and Cyberplace: TheRiseofPersonalized Networking. International Journalof Urban and RegionalResearch 25 (2), S. 227 – 252.. 10.1007/978-3-658-21742-6_133. |
Požadavky na datové zdroje |
Specifické požadavky neidentifikovány. |
Požadavky na parametry služeb |
Zpracování Big Data. Parametrizace služeb. |
Požadavky na typy služeb |
Specifické požadavky neidentifikovány. |
Požadavky na legislativu |
Specifické požadavky neidentifikovány. |
Požadavky na organizační zajištění |
Specifické požadavky neidentifikovány. |
Požadavky na metodiky, postupy |
Příklady dobré praxe. |
Požadavky na lidské zdroje |
Specifická potřeba na experty v dané oblasti, zároveň na obecné úrovni průřezový vzdělávací program. Znalosti data mining a informationmining. |
Závěr / Dopad na NIPI |
Data mining sociálních sítí poskytuje podstatná sekundární prostorová data a informace na podkladu ověřených a známých metod a technik. Oblast se vyvíjí velmi dynamicky, je nutné reagovat neustále na nové trendy, omezení, regulace a legislativu. Zároveň prostorová data a informace jsou často poplatné omezenému časovému období.
Hlavní dopad je na prostorové i neprostorová data a informace, a to zejména sekundární, odvozená. Dále ve smyslu nabízených služeb, analýz, predikcí atd.
|
Doporučení dalších kroků |
Počkat |
Doporučení dalších kroků, popis |
Sledovat. |
Poznámka |
|
Datum vytvoření / poslední aktualizace karty trendu |
10.08.2019 00:00 |
Autor karty trendu (odborný garant) |
Administrátor Katalogu
|
Editor |
|
Datum vytvoření záznamu |
01.09.2019 20:21 |
Záznam vytvořil/a |
Administrátor Katalogu
|
Datum aktualizace |
|
Záznam aktualizoval/a |
|