Schubert András: A hálózatok tudománymetriája és a tudománymetria hálózatai

A tudományos együttműködés egyre nagyobb mértékű elterjedésével a tudományos kutatást vizsgáló, elemző, értékelő tevékenységekben, így a tudománymetriában is nélkülözhetetlenné vált a hálózati szemléletmód. A hálózatelemzés módszerei, a centralitás fogalma és mérőszámai, a hálózatok kialakulásának dinamikája új dimenziókat nyitnak a tudomány mint társadalmi tevékenység leírásában, modellezésében. A cikk összefoglalja az elmúlt évtizedek néhány fejleményét a hálózati tudománymetria területén, különös tekintettel a Magyar Tudományos Akadémia keretében folyó kutatások eredményeire. A tudománymetria különféle területein használt hálózati modellek és mutatószámok mellett külön fejezet foglalkozik magának a tudománymetriának mint kutatási területnek és az azt művelő kutatóknak és intézményeknek a hálózati sajátosságaival.

Bevezetés

Ha van egyetemes tendencia a tudományok fejlődésében az utóbbi évtizedek során, akkor az együttműködés uralkodóvá válása mindenképpen az. Akár az egyes kutatókat tekintjük, akár az intézményeket vagy az országokat, a kutatási eredmények egyre növekvő arányban közös erőfeszítések gyümölcsei.

1. ábra A folyóiratcikkek átlagos szerzőszámának alakulása 1981–2012 között
(A Science Watch 2013. szeptemberi adatai alapján [1])

2. ábra Az egyszerzős folyóiratcikkek arányának alakulása 1981–2012 között
(A Science Watch 2013. szeptemberi adatai alapján [1])

Ahogyan az 1. és 2. ábra mindennél szemléletesebben mutatja, 1981 és 2012 között a társzerzők átlagos száma hozzávetőleg megduplázódott, a társszerző nélkül írt, egyszerzős cikkek aránya pedig harmadolódott.

Hogy az együttműködési készség növekedése szükségszerűen együtt jár-e a hatékonyság vagy a minőség javulásával, az viták (illetve behatóbb vizsgálatok) tárgyát képezheti (lásd pl. [2]), de a jelenség vitathatatlan.

Hozzátehetjük, hogy annak a felismerése, hogy a tudomány minden egyes eredménye – bár egyes kutatók nevéhez köthető –, voltaképpen a tudományos közösség egészének tulajdonítható, nem a legutóbbi időszak fejleménye. Furcsa módon éppen Alan Turing, egy olyan tudós, akit a kora különcnek, sőt, deviánsnak bélyegzett, írta 1948-ban: „Az elszigetelt egyén nem képes intellektuális teljesítményt kifejteni. Szükséges számára, hogy körülvegye őt olyan emberek környezete, akiknek a technikáit elsajátíthatja élete első húsz évében. Ezután talán folytat némi önálló kutatást és tesz néhány felfedezést, amit továbbad másoknak. Ebből a szempontból a kutatást nem a különálló egyének, hanem az emberi közösség egésze folytatja.” [3]

A kutatók, intézmények, országok közötti együttműködés uralkodóvá válása megkövetelte, hogy a tudományos kutatás vizsgálata, elemzése, értékelése is az egyének helyett egyre inkább a közöttük fennálló kapcsolatok felé fordítsa a figyelmét.

3. ábra A tudománymetriával és bibliometriával, illetve azok hálózati aspektusaival foglalkozó folyóiratcikkek száma 1975–2014 között (a Thomson-Reuters Web of Knowledge adatbázis adatai alapján)

Ezt a tendenciát nyomon követhetjük a tudománymetria szakirodalmában is. A 3. ábrán láthatjuk, hogy a tudománymetriával és bibliometriával foglalkozó folyóiratcikkek száma 1975 és 2014 között kb. 20 éves kétszereződési idővel növekedett. Ezen a kutatási területen belül a hálózati kapcsolatokat expliciten figyelembe vevő cikkek 1990-ben tűntek fel, és számuk azóta kb. másfélszer gyorsabban növekszik, mint a terület egésze. A szakterület legfontosabb nemzetközi publikációs fórumának számító Scientometrics című folyóiratban 2014-ben a cikkek több, mint negyedében szerepelt a „network” kifejezés a kulcsszavak között.

A hálózatok tehát ténylegesen „behálózzák” a tudományos kutatás mint intellektuális tevékenység egészét, és vizsgálatukat a tudománymetria kiemelkedően fontos elemének kell tekintenünk.

A hálózatelemzés helye a tudománymetriában

A tudománymetriát rövid, de intenzív története során számos különféle módon kísérelték meg osztályozni. Az egyik lehetőség a következő:

Strukturális tudománymetria: A tudományos közösségek, dokumentumhalmazok, fogalmak strukturális térképezése;

Dinamikus tudománymetria: A tudományos információ tér- és időbeli viselkedésének tanulmányozása;

Evaluatív tudománymetria: A tudományos kutatás szereplői (országok, intézmények, folyóiratok, egyének, stb.) tudományos teljesítményének megítélése.

4. ábra Erdős Pál társszerzőségi hálózata

A hálózatelemzés első látásra az első kategóriába, a strukturális vizsgálatok területébe sorolható. Kétségtelen, hogy a hálózatelemzés módszerei a történeti kezdetektől fogva mind a mai napig hasznos elemei a tudomány szereplői („aktorai”) közötti kapcsolatrendszerek térképezésének, elemzésének. Amint látni fogjuk azonban, ezek a módszerek mindinkább helyet kapnak a dinamikai és az evaluatív vizsgálatok eszköztárában is.

Érdekes módon a hálózati tudománymetria egy korai – mondhatni úttörő – kísérlete nem volt mentes az értékelési felhangoktól. Ez pedig az Erdős-szám [4].

Erdős Pál (1913. március 26., Budapest – 1996. szeptember 20., Varsó), a XX. század egyik legkiemelkedőbb matematikusa volt. Kivételes nagysága nemcsak saját tudományos eredményeiben mutatkozott meg, hanem abban is, hogy rengeteg nehezen bizonyítható, de különlegesen fontos problémát („sejtést”) fogalmazott meg olyan módon, hogy tanítványai, kollégái, követői azokat azután bizonyítani tudták. Ezek az eredmények Erdőssel közös társszerzős cikkekként jelentek meg, ezért azután Erdős Pálnak kivételesen nagy és szerteágazó társszerzői hálózata lett (lásd a 4. ábrát, amely 1416 cikk 509 társszerzőjét tartalmazza [5]).

Erdős társszerzőjének lenni nagy dicsőségnek számított a matematikusok között, ennek elismeréseként alkották meg az Erdős-számot.

Definíció: Erdős Pál Erdős-száma 0. Egy szerző Erdős-száma n, ha társszerzőinek Erdős-száma közül a legkisebb érték n–1.

Közérthetőbb megfogalmazásban: Erdős társszerzőinek Erdős száma 1. Azoknak a szerzőknek, akiknek nem volt Erdőssel közös cikke, de társszerzői voltak egy 1-es Erdős számú kutatónak, az Erdős-száma 2, és így tovább.

A kis Erdős-számnak értékmérő szerepet lehet tulajdonítani. A Nobel-díjasoknak és a tudományos közösség kiemelkedő személyiségeinek az Erdős-száma általában 2–4 között van (Albert Einstein: 2, Neumann János: 3, Linus Pauling: 4, John Eccles: 3, Bill Gates: 4; jelen cikk szerény szerzőjéé: 3).

Az Erdős-szám sikere sok érdekes kérdést vetett fel a matematikában és azon kívül is. Ezek egy része arra vonatkozott, hogy milyen sajátosságokkal kell rendelkeznie egy társszerzői hálózatnak ahhoz, hogy központi figurája egy Erdős-szám jellegű értékmérő mutatószám alapjául szolgálhasson. A társszerzők elegendően nagy száma mellett a hálózat szerkezete sem közömbös.

A legkiterjedtebben vizsgált ilyen hálózati sajátosság a centralitás.

A hálózatok elemeinek („csomópontjainak”) centralitása azt méri, hogy az illető elem mennyire foglal el központi (centrális) vagy perem- (periferiális) helyzetet a hálózatban. A centralitás mérésére számos különféle mutatószámot használnak a hálózatelemzésben. Néhány példa:

fokszám centralitás (hány szomszédja van);

közelségi centralitás (átlagosan hány lépésben érhető el a többi elemtől);

közbülsőségi centralitás (hány másik elem között helyezkedik el közvetve vagy közvetlenül);

sajátérték centralitás (mennyire centrálisak, illetve periferiálisak a szomszédai).

Egy hálózat egészének centralizáltsága az egyes csomópontok centralitásának egyenlőtlenségével mérhető. A centralizáltság mértéke csillaggráfokban (ahol egymással kapcsolatban nem álló elemek mindegyike egyetlen központi elemhez kapcsolódik) maximális („egyszemélyi diktatúra”), teljes gráfokban (ahol minden elem minden másikkal össze van kötve) minimális („teljes demokrácia”).

Érdekes megfigyelés, hogy bár természetesen Erdős Pál centralitása társszerzői hálózatában kétségkívül kiemelkedő, de magának a hálózatnak a centralizáltsága nem kiemelkedően nagy. Tekintve az Erdős Pál körül kialakult szerzői hálózat eredményes működését, ez a tapasztalat azt sugallja, hogy a hálózatok centralizáltságának létezhet valamiféle működési optimuma.

Krebs [5] ezt írja: „A szakértők régóta vitáznak egy személy szakmai hálózatának optimális szerkezetén. Vannak, akik azt mondják, hogy a sűrű, összetartó hálózatok nagyobb társadalmi tőkét képviselnek, mások szerint a lazább, sugaras szerkezetű hálózatok eredményesebbek, amelyek nagyobb lehetőséget adnak az innovatívabb és vállalkozóbb tevékenységeknek. Erdős hálózata mindkét mintázatot tartalmazza: egy sűrűn összekapcsolt magból lazább szerkezetű sugaras ágak nyúlnak ki. Ron Burt – a társadalmi tőke vezető szakértője – szerint ez a szerkezet lehet az optimális mintázat a sikerhez. Burt szerint a sugárirányú nyúlványok változatos információkat és tudásanyagot érnek el, míg a sűrű, megbízható központi kapcsolatrendszer a felismert lehetőségekben rejlő értéket biztosítja.” (A részletes elemzés Burt nagy hatású munkájában [6] található.)

A tudománymetria egy másfajta kategorizációja szerint a hálózatokat (is) a szereplők („aktorok”) mérete szerint osztályozhatjuk. Alulról felfelé haladva, vannak

mikroszintű,

mezoszintű és

makroszintű hálózatok.

Az Erdős-szám alapjául szolgáló hálózat mikroszintű: elemeit egyének alkotják. Mikroszintűnek tekinthető még a kutatócsoportok hálózatainak vizsgálata is.

A mezoszintű hálózatokban a kapcsolatok intézmények vagy például folyóiratok között jönnek létre. Ha a folyóiratoknál maradunk, azok között is számtalan kapcsolati forma vizsgálható: közös szerzők, szerkesztők, kulcsszavak, hivatkozások/idézetek stb.

5. ábra A folyóiratok együttidézettségi térképe

Az 5. ábrán (A folyóiratok együttidézettségi térképét lásd a belső borítón is.) a világ körülbelül 5000 vezető tudományos folyóiratának térképe látható, amelyet az együttidézettség („co-citation”) alapján készítettek el, vagyis két folyóirat távolságát aszerint állapították meg, hogy milyen mértékben fordulnak elő együtt az őket idéző cikkek irodalomjegyzékében [7, 8].

Az ilyen térképek hasznosak a könyvtár- és információtudomány számára abban, hogy a folyóiratokat a valósághoz minél jobban idomuló besorolási rendszerbe illeszthessük. Hasznosak továbbá az egyes folyóiratok számára is, hogy pontosan megtalálják, meghatározzák helyüket a folyóiratok rendszerében.

6. ábra Az Orvosi Hetilap valószínűsíthető helyzete a folyóiratok együttnézettségi térképén

Ezt kíséreltük meg például az Orvosi Hetilap című folyóirat esetében [9] (Az Orvosi Hetilap valószínűsíthető helyzete a folyóiratok együttidézettségi térképét lásd a belső borítón is.), annak ellenére, hogy ez a folyóirat egyáltalában nem szerepel az eredeti térképen.

7. ábra A nemzetközi társszerzőségi kapcsolatok alakulása 1985–1995 között

A makroszintű vizsgálatok tárgyát az országok, geopolitikai régiók képezik. Az egyre növekvő nemzetközi társszerzőség kedvező feltételeket teremt az országok közötti hálózati kapcsolatok vizsgálatához. Tanulságos eredményt hozott például az a vizsgálat, amely az 1990-es évek elejének világpolitikai változásainak hatását követte a nemzetközi társszerzői kapcsolatok alakulásának tükrében [10]. A legdrámaibb változás természetesen a Közép-Kelet-Európai régiót érintette: a relatív izoláltság után ezek az országok a centralitásában jelentősen megerősödött Németországhoz kapcsolódva találták meg új helyüket a térképen.

8. ábra A konferenciák rendezési helye és konferenciakiadványok szerzőinek nemzeti hovatartozása alapján készített „szcientopográfiai” térkép

Megjegyezhetjük, hogy ezt a vizsgálatot az időbeliség figyelembevétele miatt a strukturális-dinamikai hálózati tudománymetria példájaként tekinthetjük.

Az eddig példaként tekintett hálózatok szimmetrikus kapcsolatokon alapultak (ha egy szerző társszerzője egy másiknak, akkor a másik is társszerzője az egyiknek). A tudománymetriában azonban nagy jelentőségük van az aszimetrikus kapcsolatokon alapuló hálózatoknak is. Legelső példaként mindjárt az idézettségi kapcsolatot említhetjük. Bármilyen aktorokat (szerzőket, országokat, folyóiratokat) vizsgálunk is, az egymásra való hivatkozások kölcsönössége lehetséges, de nem szükséges sajátosság. Két kutató idézheti egymást rendszeresen kölcsönösen, de lehet, hogy ez a „vonzalom” csak egyirányú. A különbség nemcsak személyes tényezőkön múlhat, hanem erősen befolyásolhatják például a művelt kutatási témák is. A kapcsolatok szimmetriája, illetve aszimmetriája a tudománymetriai hálózatok vizsgálatának hálás témája (a folyóiratok esetére lásd pl. [11]).

Szimmetrikus és aszimmetrikus kapcsolatokat egyaránt találhatunk abban a hálózatban is, amelyet az egyes országok kutatóinak más országokban tartott tudományos konferenciáin való részvételi statisztikáiból szerkeszthetünk [12]. E hálózat látványos világtérképét mutatjuk be a 8. ábrán.

Mindeközben otthon a tanyán... [13],
avagy ki, kivel, hányszor?

Egy korábbi cikkben [14] megkíséreltem áttekinteni a tudománymetria magyarországi történetének kezdeti időszakát. Most visszatérnék erre a témára abból a szempontból, hogy hogyan jelentkeztek akkori munkáinkban a hálózatok vizsgálatára irányuló törekvések.

A 80-as évek közepén kezdtünk két matematikus kollégámmal, Glänzel Wolfganggal és Telcs Andrással az úgynevezett „halmozódó előnyök” jelenségének elméletével foglalkozni, ami olyan közkeletű bölcsességeket próbált egzakt formába önteni, mint hogy „akinek van, annak adatik” vagy „a pénz oda megy, ahol már úgyis van”. Az ilyen modellek a közgazdaságtanban már régen ismertek voltak (Pareto, Gibrat, Herbert Simon is foglalkoztak például vele), de úgy éreztük, hogy tudunk új gondolatokat, matematikai eredményeket hozzátenni a már meglévőkhöz. És úgy is lett. Példáinkat nem annyira a közgazdaságtan, mint inkább a szociológia, a nyelvtudomány és természetesen a tudománymetria területéről vettük [15, 16, 17]. Minél több cikket publikált valaki, annál könnyebben írja meg a következőt. Minél több idézetet kapott valaki, annál könnyebben kap újabbakat. Saját példánkon is tapasztalhattuk ezt: egyre könnyebben írtuk az újabb cikkeket, és kaptuk rájuk az idézeteket.

Kínálkozott a módszer kiterjesztése a társszerzői kapcsolatokra is. Minél többször írt már korábban két kutató közös cikket, annál könnyebben írnak újra együtt. Itt azonban közbeszólt a két matematikus kollégám. Hohó, ez nem ugyanaz! A korábban vizsgált jelenségek, úgymond, egydimenziósak voltak: a „halmozódás” mindig egyetlen mennyiségre – pénz, cikkszám, idézetszám – korlátozódott. A társszerzőség esetében viszont egy két-, sőt, többdimenziós hálózatot kell vizsgálni, és ez matematikailag teljesen más feladat. Meggyőztek – és szakmailag teljesen igazuk volt –, hogy a jelenség vizsgálatához szükséges matematikai, gráfelméleti apparátus valójában nem is létezik; néhány éppen akkoriban megjelent matematikai cikk tartalmazott az érdemi vizsgálatokra még távolról sem alkalmas kezdeti eredményeket. Vegyészként én persze engedtem volna a szigorúságból, és ha matematikailag modellezni nem tudtunk is, empirikus mérésekkel, közelítésekkel próbálkoztam volna, de ezzel legkedvesebb kollégáim súlyos rosszallását hoztam volna a fejemre. Minthogy számos más izgalmas kutatási feladatunk is volt, ezt a témát lezártuk.

Barabási László, az Erdélyből az Egyesült Államokba származott fizikus a 90-es végén kezdett foglalkozni az általa „kedvezményezett kapcsolódásnak” (preferential attachment) nevezett mechanizmus révén létrejött hálózatok tulajdonságaival. Ez lényegében azonos volt azzal, amit mi annak idején „halmozódó előnyök” néven vizsgáltunk. Barabási „halmozottan előnyös” helyzetben volt ahhoz, hogy sikert érjen el ott, ahol mi elakadtunk. Fizikusként felületi struktúrák kialakulásával foglalkozott, ezért járatos volt olyan modellek használatában, amelyek a még akkor is hiányzó szigorú gráfelméleti alapokat saját maga és mások számára is meggyőzően tudták helyettesíteni. Ezeknek a modelleknek a jellemzője a „reciprok hatványfüggvény” szerinti viselkedés, akármit jelentsen is ez. Modelljének bemutatására pedig olyan példákat talált, amelyek sokkal nagyobb érdeklődést keltettek, mint a társszerzőség körömlerágató izgalmai: a World Wide Web szerkezetét vagy a hollywoodi színészek közös filmszereplésének hálózatát. Mindemellett egy jóhírű amerikai egyetem (University of Notre Dame, Indiana) munkatársa volt. Az 1999-től a Nature-ben, a Science-ben és hasonló színvonalú folyóiratokban megjelent hálózatelméletei cikkei több tízezres idézettséget és világhírnevet szereztek neki. Népszerű könyvével [18] a szélesebb magyarországi ismertséget is megszerezte.

Személyesen 2000-ben ismerkedtem meg vele, amikor a Collegium Budapest vendégkutatója volt, akkor meséltem el neki a 80-as évekbeli próbálkozásainkat. Ennek eredménye lett két 2002-ben megjelent közös publikációnk [19, 20], melynek egyikében („Tudományos együttműködések társadalmi hálózatainak fejlődése”) egyik 1984-es „egydimenziós” cikkünk [15] is bekerült a hivatkozásjegyzékbe. A kék norvég nem halt meg, csak mélyen aludt...

A következő inspiráció is egy amerikai fizikustól jött. Őt Jorge E. Hirsch-nek hívják, és az UCSD (University of California, San Diego) professzora. Argentin születésű, magyar vonatkozásáról nem tudok azon kívül, hogy 1977-ben a Chicagói Egyetemen elnyerte a legjobb jelölti vizsgáért (Best Candidacy Examination) járó Telegdi díjat. Kiemelkedő kvantumfizikai munkásságán kívül, a nukleáris háború veszélye elleni aktív kiállásáról ismerhették egészen 2005-ig, amikor is megjelent „Az egyének tudományos kutatási teljesítményének mérésére szolgáló index” című írása. Először az arXiv nevű és a fizikusok között alapvető kommunikációs csatornának számító preprint-gyűjteményben, majd miután a Nature egyik belső munkatársa felhívta rá a figyelmet egy kis írásban, a Proceedings of the National Academy of the Sciences of the USA című igen tekintélyes folyóiratban [21]. Ez a cikk azóta több, mint ezer idézetet kapott, és a benne javasolt h-index (és alkotója) számára a szentté avatástól a kerékbe törésig már mindent ajánlottak.

Az index rendeltetésszerű használata kevéssé keltette fel az érdeklődésemet, bár szerkesztőként, bírálóként, alkalmazási tanácsadóként többet kellett vele foglalkoznom, mintha csak érdekelt volna. Igazán izgalmasnak azt a matematikai-statisztikai ötletet találtam, ahogyan az indexet ki kell számítani. Hirsch javaslata szerint a publikációkat csökkenő idézettségük szerint sorba kell rendezni, és meg kell keresni azt a legnagyobb sorszámú cikket, amelynek sorszáma nem nagyobb az idézettségénél. Ez a sorszám a h-index. Ha tehát valakinek a tizedik legidézettebb cikke éppen tíz idézetet kapott, akkor a h-index értéke 10. Két kérdés izgatott. Vajon hol van a helye a h-indexnek, milyen kapcsolatban áll az átlaggal, a mediánnal, a szóródás mérőszámaival, stb. a statisztikai mutatószámok kiterjedt családjában? És vajon mi mindenre lehet még egy ilyen módon definiált indexet használni a tudományelemzésben, a sportstatisztikákban, a közgazdaságtanban vagy bárhol másutt?

A második kérdéshez érdekes adalékkal szolgált a Nature egy olvasói levele [22], amelyből kiderült, hogy a levélíró baráti társasága az 1960-as években egy ilyen elven kiszámított mutatószámot használt (az ötletet a neves asztrofizikusnak, Arthur Eddingtonnak tulajdonítva) kerékpározási teljesítményük nyilvántartására. A lehetőségek tehát valóban korlátlanok.

9. ábra Folyóiratok elméleti és tapasztalati h-indexe

Az első kérdés megválaszolása komolyabb szakértelmet kívánt. A máig is legalapvetőbb eredményt ebben a témában 2006-ban Glänzel Wolfgang (akkor már a Leuveni Katolikus Egyetem professzora) publikálta. A h-index rokonait az úgynevezett extrémérték statisztikákban találta meg, vagyis a „szélsőséges” jelenségek (árvizek, sportrekordok, tőzsdei kilengések) leírására használt formulákban. Ennek alapján egy egyszerű és hasznos összefüggést talált a h-index (h) az átlagérték (x) és a mintanagyság (n, alapesetben a cikkek száma) között: h = c n^1/3x^2/3; ahol c 1 nagyságrendű pozitív állandó [23]. Ezt a formulát nagy empirikus mintán, a Thomson-Reuters Web of Science folyóiratbázisának példáján igazoltuk először [24] – a 9. ábra tanúsága szerint sikerrel.

Ez az egyszerű összefüggés azért is jelentős, mert rámutat arra, hogy a h-index nem egy minden mástól független varázsszer, hanem a jól ismert statisztikai mutatószámok családjának egy kissé különc tagja. Az összefüggés érvényességének természetesen vannak matematikai feltételei, amelyek közül az egyik pontosan a „reciprok hatványfüggvény” szerinti viselkedés! Ezt szinte felhívásnak éreztem, hogy megpróbáljuk a Barabási-féle hálózatokat Hirsch-tipusú mutatószámokkal jellemezni. A próbálkozás sikeres volt, Telcs Andrással (akkor már a BMGE professzora) és Korn Andrással írt cikkeinkben többek között társszerzőségi hálózatokat és az internet részhálózatait jellemeztük ilyen módon [25, 26].

A h-indexet sokféleképpen alkalmazhatjuk hálózatokra, az egyik lehetőség a következő. Tekintsünk egy közösséget, amelynek tagjai egymással egy vagy több alkalommal partnerkapcsolatra léphetnek. Ez lehet kutatók közötti társszerzőség, művészek közötti együttes játék vagy alkotás, vagy éppenséggel szexuális partnerek közötti együttlét. Egy személy partnereit sorba rendezhetjük a kapcsolati alkalmak csökkenő száma szerint, és megtalálhatjuk azt a h-indexet, ahol a sorszám éppen „keresztezi” a kapcsolatok számát. Ezt nevezhetjük az illető személy partnerkapcsolati (φ) indexének. Ez az index érdekes jellemzést ad a személyeknek a hálózatban elfoglalt helyzetéről, és a hálózati helyzetnek más tulajdonságokkal (például produktivitás, népszerűség) való kapcsolatáról. Saját közölt eredményeim a tudományos társszerzőségről és a dzsessz-zenészek közös lemezfelvételeiről szóltak [27, 28]; a társszerzőség modelljén alkalmazták az indexet az eddigi legnagyobb elemszámú (egymilliós!) mintán [29], de érdekes visszajelzéseket kaptam a világ különböző részein a legkülönfélébb hálózatokon végzett vizsgálatokról.

Szinte minden partnerkapcsolatra igaz az, hogy az „egyéjszakás kalandok” kevéssé járulnak hozzá a valódi tapasztalatok megszerzéséhez. A Hirsch típusú partnerkapcsolati index érdekes tulajdonsága, hogy az értéke 1, ha a személynek 1 partnerrel volt kapcsolata tetszőleges alkalommal és/vagy tetszőleges számú személlyel 1-1 alkalommal. Az index értéke annál nagyobb, minél több a tartós kapcsolatok száma. Lehet, hogy ez mérné az igazi tapasztaltságot?

Az információs hálózatok hatékonysága

Arthur Koestler az intellektuális alkotásról szóló monumentális esszéjében [30] vezeti be a „biszociáció” fogalmát, mint a tudományos és művészi kreativitás, valamint a humor közös forrásmechanizmusát. Biszociáció akkor történik, ha két külön-külön jól ismert dolog, fogalom váratlan kapcsolatba lép egymással. Koestler könyvében oldalak százain sorakoznak a meggyőző példák arra, hogy hogyan vezethetők vissza a nagy tudományos felfedezések, művészi alkotások és a legjobb viccek egy-egy sikeres biszociációra.

Érdekességként megemlítem, hogy a biszociációt meg lehet próbálni nyomon követni tudománymetriai eszközökkel – ha úgy tetszik, a tudománymetriai hálózatelemzés módszerével. Két külön-külön gyakran előforduló kulcsszó együttes megjelenése, két külön-külön gyakran idézett cikk együttes idézése lehetnek például olyan események, amelyek valamilyen számottevő új gondolat megjelenését indikálhatják. Természetesen ha a biszociációt nem a múltban, hanem a jelenben keressük, akkor megkísérelhetjük a jelentős felismerések, „áttörések” előrejelzését is. Egy ilyen előrejelzéssel próbálkoztunk a szervetlen kémia egyik legjelentősebb folyóiratának vizsgálata során [31], és ezeknek az előrejelzéseknek a nagy része egy 18 éves nyomkövetés után be is igazolódott [32].

A biszociációt valójában most csak azért hoztam szóba, hogy aláhúzzam vele a jelen fejezet témának potenciális jelentőségét. Elcsépelt közhelynek számít az, hogy az információ korát éljük, és az is, hogy a hatékonyság napjaink egyik fő jelszava. A biszociáció szellemében azt várhatjuk tehát, hogy az információ hatékonysága korunknak mintegy kvintesszenciája lehetne. Ha azonban alaposabban utánajárunk a kérdésnek, akkor árnyaltabb képet kapunk [33].

Hatásfok és hatékonyság

Az angol „efficiency” kifejezésnek a magyarban két megfelelője is van: hatásfok és hatékonyság.

A hatásfokot a tényleges teljesítménynek az optimális teljesítményhez mért értékével határozhatjuk meg.

A hatékonyságot az eredmények és a ráfordítások arányaként szokás értelmezni.

Egy adott rendszerben rendkívül sokféle dolgot tekinthetünk teljesítménynek, eredménynek és ráfordításnak. Ezeket különféle módon mérhetjük, és többféleképpen értelmezhetjük az elérhető (elérendő) optimumot is. Ennek megfelelően ugyanannak a rendszernek a hatásfoka és a hatékonysága is különböző szempontok szerint egészen különböző lehet. Ez igaz már egy olyan egyszerű fizikai eszközre is, mint egy izzószál, amelynek hatékonysága egészen más lehet, ha fűtő-, mintha világítóeszköznek tekintjük. Bonyolultabb felépítésű és működésű rendszerekben ez hatványozottan igaz.

A hatásfok és a hatékonyság értelmezése és mérése tehát mindig csak egy jól meghatározott cél ismeretében, annak szempontjából lehetséges.

Ez a kitétel egyébként minden értékelési tevékenységnél kulcsfontosságú!

Az információ hatékonysága

Az információ hatékonyságát napjainkban főként a pénzügyi (tőzsdei) és a fogadási piacok vonatkozásában szokás elemezni. Itt a hatékonyságot többnyire azzal a sebességgel mérik, amellyel a releváns információk eljutnak a piacok releváns szereplőihez. Ez a szemlélet felhasználható a tudományos információ (vagy pl. az információs szolgáltatások) hatékonyságvizsgálatának során is, de itt többnyire nem a sebességet tekintik a legmeghatározóbb attribútumnak.

A hálózatok hatékonysága

A hálózatok hatékonysága vizsgálatának szakirodalmi példáit főként a telekommunikációs hálózatok területén találhatjuk, ahol általában a hálózat elemei (csomópontjai) közötti kapcsolati sebesség, az energiafelhasználás vagy a költség képezik a hatékonyság számításának alapját.

A kutatási hálózatok esetében ezek kevéssé releváns szempontok. Felmerült viszont pl. a hálózat elemei közötti legrövidebb átlagos úthossz, mint hálózati hatékonysági mutatószám [34]. Ennek az érdekessége az, hogy míg bizonyos hálózatok esetében ez a felhasználók által közvetlenül érzékelhető minőségi tényező (pl. közlekedési hálózatok: átszállások száma), más esetekben (pl. digitális adatátvitel: e-mailek továbbítása) teljességgel rejtve marad.

Információs hálózatok hatékonysága

A szakirodalomban ilyen címszó alatt főleg az az igény fogalmazódik meg, hogy milyen fontos lenne kidolgozni az információs hálózatok hatékonyságának objektív mutatószámait és mérési módszertanát. Bár a témából már nemzetközi konferenciákat is rendeztek, egyelőre nem látszik körvonalazódni általánosan használható fogalmi keret vagy pláne konkrét módszertan.

A tudományos kutatás információs hálózatai hatékonyságának vizsgálata során tehát nemigen támaszkodhatunk általános eredményekre, hanem egyes esetekre kidolgozott specifikus eredményekből kell építkeznünk.

A tudományos kutatás információs hálózatai

A tudományos kutatás információs hálózatainak példái szerteágazóak és változatosak. Ide tartoznak a kutatók és kutatási intézmények közötti formális és informális kapcsolatok, a közös pályázatok és a hozzájuk kapcsolódó virtuális és valóságos műhelytalálkozók (workshop) és konferenciák, stb. Ezek jelentőségét nem kisebbítve a tudománymetria szokásos és többé-kevésbé bevált szemlélete azoknak a kapcsolati hálózatoknak ad elsőbbséget, amelyek a tudomány formális, hivatalos és ellenőrzött fórumai – mindenekelőtt az elsőközlő tudományos folyóiratok – által publikált információkban jelennek meg.

Ezek legjellemzőbb példái a társzerzőségi és az idézettségi kapcsolatok.

A társszerzői hálózatok hatékonysága

A társszerzői hálózat hatékonyságával az Erdős-szám példájával kapcsolatban már foglalkoztunk. Megállapíthattuk, hogy az Erdős Pál társszerzői hálózatához hasonló „hibrid” (egy sűrű, erősen összefüggő magot és lazább szerkezetű „nyúlványokat” tartalmazó) hálózat valamiféle működési optimumot képvisel.

Egy másik vizsgálatban a „hatékonyságot” egy jeles nemzetközi tudományos díj, a nukleáris analitikai kémiai kutatásokért kiérdemelhető Hevesy Emlékérem 34 díjazottjának példáján vizsgáltuk meg [27].

Minden díjazottnak feltérképeztük a társszerzői hálózatát. A hálózat szerkezeti jellemzőjeként a partnerkapcsolati (φ) indexet választottuk. Az eredményességet a díjazottak idézettségi h-indexével jellemeztük. Azt találtuk (lásd a 10. ábrát), hogy a partnerkapcsolati index növekedése egy bizonyos határig az idézettségi h-indexszel mért „teljesítmény” növekedésével jár együtt. E határ fölött azonban ez az összefüggés megszűnni látszik. Az együttműködés „hatékonyságának” tehát – Ron Burt elképzelésének megfelelően – itt is kimutatható egy optimális szintje.

10. ábra Az idézettségi h-index és a φ-index kapcsolata a Hevesy-Emlékérem díjazottjainak példáján

Az idézettségi hálózatok hatékonysága

Már az idézetelemzés kezdeti korszakában (az 1970-es években) történtek próbálkozások, hogy az idézeteket ne csak számuk szerint, hanem valamilyen súlyozott módon vegyék figyelembe. Narin és munkatársai a folyóiratok értékelésére vezette be az „influence weight” mutatószámot, amely a közgazdaságtanban használt „ágazati kapcsolatok mérlege” módszertanát kísérelte meg a folyóiratok információforgalmára átültetni.

Az „influence weight” kései leszármazottjai a Thomson-Reuters Web of Knowledge Journal Citation Reports adatbázisában 2007 óta megtalálható Eigenfactor Score és Article Influence Score mutatószámok, valamint a SCImago (az Elsevier Scopus adatbázisa alapján szerkesztett tudománymetriai adatbázis) SCImago Journal Rank (SJR) mutatószáma. Az SJR közvetlenül a Google PageRank mintájára készült.

Mindezek a próbálkozások arra irányulnak, hogy az „értékesebb” forrásból származó idézetek nagyobb súlyt kapjanak, mint a „kevésbé értékesek”.

Bizonyos esetekben azonban ezt a célt úgy is elérhetjük, hogy nem használunk mesterséges súlyozást.

Gyakran úgy szerzünk tudomást egy publikáció létezéséről, hogy egy másik publikáció irodalomjegyzéke hívja fel rá a figyelmünket. Az idézet tehát nemcsak dokumentálja, hanem generálja is az idézett cikkre irányuló figyelmet. Ezt nevezhetjük közvetett idézettségi hatásnak.

Ennek méréséhez tekintsük egy cikk h-indexének az őt idéző cikkek halmazának h-indexét [35]. Ha összehasonlítjuk pl. két folyórat azonos idézettségű cikkeinek h-indexét, megfigyelhetjük az azonos közvetlen idézettségi hatású cikkek közvetett idézettségi hatásának különbségét. A 11. ábrán láthatjuk, hogy az azonos idézettségű Cell- és JACS-cikkek közül a Cell-cikkek h-indexe nagyobb, mert a Cell-cikkeket idéző cikkeket általában többet idézik.

11. ábra A Cell- és a JACS-cikkek közvetett idézettségi hatásának összehasonlítása

A tudománymetria hálózatai

A tudománymetria egyedülálló sajátossága az „önreflexivitás”: azon kevés tudományágak közé tartozik, amelyek képesek saját eszközeikkel vizsgálni saját magukat [36]. A tudománymetria irodalmában bőségesen találunk példákat olyan tanulmányokra, melyekben a vizsgálati mintát a tudománymetria dokumentumai, illetve „aktorai” szolgáltatják.

12. ábra A Scientometrics című folyóirat első 50 kötete szerzőinek országok szerinti statisztikái. a) Az egyes országok szerzői produktivitása (az ország ábrázolt területe a megjelent cikkek számával arányos); b) a társszerzői kapcsolatok hálózata

A Scientometrics című nemzetközi folyóirat (melynek alapító főszerkesztőjét, Braun Tibor professzort a jelen folyóiratban megjelent előző cikkemben [14] már volt lehetőségem bemutatni) rendszeresen közöl olyan cikkeket, amelyeknek tárgya maga a folyóirat. A folyóirat első 50 kötetéről készült elemzésből [37] az országokra vonatkozó produktivitási és együttműködési térképeket mutatjuk be a 12a és 12b ábrán.

13. ábra A Scientometrics című folyóirat 1978–2010 közötti cikkeinek országok szerinti társszerzői hálózata

Egy tíz évvel későbbi hasonló vizsgálatban [38] az országok közötti társszerzői hálózat a 13. ábrán látható képet mutatta. A Magyarország és Belgium közötti jelentősen megerősödött társszerzői kapcsolat személyes hátterét természetesen jól ismerjük: 2002 óta Wolfgang Glänzel az MTA Könyvtár és Információs Központ tudományos tanácsadói tiszte mellett a Leuveni Katolikus Egyetem professzoraként is tevékenykedik.

14a. ábra A Scientometrics című folyóirat társszerzői hálózata: szerzők

14b. ábra A Scientometrics című folyóirat társszerzői hálózata: intézmények

14c. ábra A Scientometrics című folyóirat társszerzői hálózata: országok

Kuriózumként egy olyan cikket is megemlítek, amelyik azt bizonyítja, hogy a folyóirat és témája a világ egy igen távoli zugában (Malajzia) is érdeklődésre és értő követésre talál. Erfanmanesh és munkatársai [39] feltérképezték a Scientometrics társszerzői hálózatát mikro-, mezo- és makroszinten egyaránt (14a–c ábrák). A térképek mellett a szerzők kiszámították a mikro-, mezo- és makroszintű szereplők (szerzők, intézmények, országok) centralitásának többféle mérőszámát is. Meghatározták a „stratégiailag jelentős” szerzőket és intézményeket, akik/amelyek produktivitásukat és centralitásukat tekintve is kiemelkednek a többiek közül (az ábrákon ezek név szerint fel vannak tüntetve).

Természetesen a tudománymetria irodalma messze nem korlátozódik a Scientometrics folyóiratra, és nyilvánvaló, hogy ha más forrásokat is bevonunk a vizsgálatba, akkor az itt bemutatott hálózati térképek is módosulni fognak. Ha pedig például a Scientometrics-nek a folyóiratok hálózatában elfoglalt helyzetére vagyunk kíváncsiak, akkor egyenesen nélkülözhetetlen egy szélesebb körű merítés.

Egy egészen friss ismertető tanulmány, amely átfogó képet kísérel meg adni a tudománymetria történetéről, jelen állásáról és jövőjéről [40], bemutatja a szakterülettel foglalkozó folyóiratok hálózati térképét. A térkép (lásd a 15. ábrát) az egyes folyóiratokat idéző cikkek hasonlósága alapján készült. A Scientometrics központi helyzete nyilvánvaló: összekapcsolja az információtudományi, a tudománypolitikai és az általános természettudományi klasztereket.

15. ábra A Scientometrics című folyóirat helyzete a tudománymetriával foglalkozó folyóiratok hálózatában

A már említett VOSviewer szoftver segítségével [8, 9] meghatározhatjuk a Scientometrics helyzetét a teljes folyóiratuniverzum együttidézettségi térképén (16. ábra A Scientometrics című folyóirat helyzete a folyóiratok együttidézettségi térképét lásd a belső borítón.). Természetesen a Scientometrics itt már korántsem foglal el olyan központi helyzetet; mindenesetre a társadalomtudományi folyóiratok baráti társaságában elég jó rálátása van a tudományos folyóiratvilág egészének színes kavalkádjára.

Befejezés

Sohasem tagadtam meg vegyész múltamat (lásd pl. [14]). Az élet legkülönbözőbb területein, így a tudománymetriai kutatásokban is nagy hasznomra volt az a szemléletmód, amit vegyészmérnökként elsajátítottam. Ha a hálózatokról gondolkodom, akkor is elsőként azok az atomokból, molekulákból álló szerkezetek jutnak az eszembe, amelyek leírását, modellezését a legjobban ismerem. Nemrégiben egy előadásomnak azt a címet is adtam, hogy A tudománymetria atomjai és molekulái. A gondolat egészen felvillanyozott, és azóta is tervezem, hogy továbbgondolom, és részletesebben kidolgozom ezt az ötletet.

A kételkedőknek pedig hadd ajánljam figyelmébe a 17. ábrát, amelynek bal oldalán a folyóiratok együttidézettségi térképe, jobb oldalán pedig az aszpartil-tRNS szintetáz fehérje molekula modellje látható. Hát lehetséges volna, hogy semmi közük nincsen egymáshoz? (Az ábrát lásd a belső borítón.)

[1] http://sciencewatch.com/articles/single-author-papers-waning-share-output-still-providing-tools-progress

[2] W. Glänzel, A. Schubert, Double effort = Double impact? A critical view at international co-authorship in chemistry. Scientometrics, 2001, 50(2):199–214.

[3] „...the isolated man does not develop any intellectual power. It is necessary for him to be immersed in an environment of other men, whose techniques he absorbs during the first twenty years of his life. He may then perhaps do a little research of his own and make a very few discoveries which are passed on to other men. From this point of view [research] must be regarded as carried out by the human community as a whole, rather than by individuals.”

A. Turing, Intelligent machinery (1948). In: D.C. Ince (szerk.): Collected Works of A.M. Turing – Mechanical Intelligence, pp. 107–127. North Holland, 1992. Az eredeti kéziratoldal megtekinthető itt: http://www.alanturing.net/turing_archive/archive/l/l32/L32-019.html

[4] Lásd pl. Erdős Number Project: http://www.oakland.edu/enp

[5] V. Krebs, http://www.orgnet.com/Erdos.html

[6] R. S. Burt, The Network Structure of Social Capital. Research in Organizational Behavior, 2000, 22:345–423.

[7] N. J. Van Eck, L. Waltman, Software survey: VOSviewer, a computer program for bibliometric mapping. Scientometrics, 2010, 84(2):523–538.

[8] http://www.vosviewer.com/maps/journals/

[9] Schubert A., Az Orvosi Hetilap az orvosi folyóiratok hálózatában. Orvosi Hetilap, 2014, 155(22):876–879.

[10] A. Schubert, T. Braun, Scientopography: World maps and charts based on scientometric indicators. A bird’s eye view on the metropolis and beyond. In: Waast R. (szerk.), 20th Century Sciences: Beyond the Metropolis. Vol. 6. Paris, ORSTOM, 1996, pp. 65–72.

[11] A. Schubert, Measuring the similarity between the reference and citation distributions of journals. Scientometrics, 2013, 96(1):305–313

[12] W. Glänzel, B. Schlemmer, A. Schubert, B. Thijs, Proceedings literature as additional data source for bibliometric analysis. Scientometrics, 2006, 68(3):457–473.

[13] http://en.wikipedia.org/wiki/Meanwhile,_back_at_the_ranch

[14] Schubert A., A tudománymetria kezdetei Magyarországon. Szigorúan személyes szemelvények. Könyv és Nevelés, 2014, 16(1):21–31.

[15] A. Schubert, W. Glänzel, A dynamic look at a class of skew distributions. A model with scientometric applications. Scientometrics, 1984, 6(3):149–167.

[16] A. Telcs, W. Glänzel, A. Schubert, Characterization and statistical test using truncated expectations for a class of skew distributions. Mathematical Social Sciences, 1985, 10:169–178.

[17] W. Glänzel, A. Schubert, The cumulative advantage function. A mathematical formulation based on conditional expectations and its application to scientometric distributions. In: L. Egghe, R. Rousseau (szerk.), Informetrics 89/90, Elsevier, Amsterdam, 1990, pp. 139–147.

[19] A. L. Barabási, H. Jeong, Z. Néda,. A. Schubert, T. Vicsek, Evolution of the social network of scientific collaborations. Physica A, 2002, 311(3–4):590–614.

[20] I. Farkas, I. Derenyi, H. Jeong, Z. Neda, Z. N. Oltvai, E. Ravasz, A. Schubert, A.-L. Barabási, T. Vicsek, Networks in life: scaling properties and eigenvalue spectra. Physica A, 2002, 314:25–34.

[18] A. L. Barabási, Linked: The New Science of Networks. Perseus Books Group, 2002. Magyar nyelven: Behálózva – a hálózatok új tudománya, Magyar könyvklub, 2003.

[21] J. E. Hirsch, An index to quantify an individual’s scientific output. Proceedings of the National Academy of Sciences of the United States of America, 2005, 102:16569–16572, http://arxiv.org/abs/physics/0508025

[22] A. W. F. Edwards, System to rank scientists was pedalled by Jeffreys. Nature, 2005, 437:951.

[23] W. Glänzel, On the h-index – A mathematical approach to a new measure of publication activity and citation impact. Scientometrics, 2006, 67(2):315–321.

[24] A. Schubert, W. Glänzel, A systematic analysis of Hirsch-type indices for journals. Journal of Informetrics, 2007, 1(1):179–184.

[25] A. Korn, A. Schubert, A. Telcs, Lobby index in networks, Physica A, 2009, 388(11):2221–2226.

[26] A. Schubert, A. Korn, A. Telcs, Hirsch-type indices for characterizing networks. Scientometrics, 2009, 78(2):375–382.

[27] A. Schubert, A Hirsch-type index of co-author partnership ability. Scientometrics, 2012, 91(1):303–308.

[28] A. Schubert, Jazz discometrics – A network approach. Journal of Informetrics, 2012, 6(4):480–484.

[29] G. Cabanac, Experimenting with the partnership ability φ-index on a million computer scientists. Scientometrics, 2013, 96(1):1–9.

[30] A. Koestler, The Act of Creation, Penguin Books, New York, 1964. Magyarul: A Teremtés, Európa Könyvkiadó, Budapest, 1998.

[31] A. P. Schubert, G. A. Schubert, Inorganica Chimica Acta: its publications, references and citations. An update for 1995–1996. Inorganica Chimica Acta, 1997, 266(2):125–133.

[32] A. Schubert, A follow-up study of title word bisociations in Inorganica Chimica Acta. ISSI Newsletter, 2013, 9(3):54.

[33] Schubert A., A tudományos kutatás információs hálózatainak hatékonysága. In: Kutatási, fejlesztési és innovációs teljesítmények mérési és értékelési módszerei. Pannon Egyetemi Kiadó, Veszprém, 2014.

[34] B. Verspagen, Small Worlds and Technology Networks: The Case of European Research Collaboration, KNOW Conference, Athens, 2001

[35] A. Schubert, Using the h-index for assessing single publications, Scientometrics, 2009, 78(3):559–565.

[36] A. Schubert, Scientometrics as a Quantitative Self-reflection of the Social Sciences. EARLI, 12th Biennial Conference Budapest, 2007. Angol nyelvű absztrakt: http://earli2007.hu/nq/home/invited_sessions/earli_invited_expert_panel_discussion/scientometrics_as_the_quantitative_self-reflection_of_the_social_sciences/

[37] A. Schubert, The Web of Scientometrics. A statistical overview of the first 50 volumes of the journal. Scientometrics, 2002, 53(1):3–20.

[38] Y.-w. Chen, K. Börner, S. Fang, Evolving collaboration networks in Scientometrics in 1978–2010: a micro–macro analysis. Scientometrics, 2013, 95(3):1051–1070.

[39] M. Erfanmanesh, V. A. Rohani, A. Abrizah, Co-authorship network of scientometrics research collaboration. Malaysian Journal of Library & Information Science, 2012, 17(3):73–93.

[40] L. Leydesdorff, S. Milojević, Scientometrics. M. Lynch (szerk.): International Encyclopedia of Social and Behavioral Sciences, Section 8.5: Science and Technology Studies, Subsection 85030. Elsevier, 2015.

[41] Atoms and molecules of scientometrics. Authors, publications, references, citations and the bonds among them. Toulouse, November 7, 2013.

András Schubert: Scientometrics of networks and the networks of scientometrics

With the ever growing spread of scientific collaboration, network approach became a necessity in activities studying, analyzing, evaluating scientific research, such as in scientometrics. The toolkit of network analysis, the concept and measures of centrality, the dynamics of network evolution open new dimensions in the description and modelling of science as social activity. The paper surveys some of the developments in the past decades in the area of network scientometrics with special regard to the results of the research performed at the Hungarian Academy of Sciences. In addition to the network models and measures used in the various areas of scientometrics, a separate chapter is devoted to the network features of scientometrics as a research field and of the researchers and institutions active in this field.

___________________________________________________________________________