WoS - bavla/biblio GitHub Wiki

Analiza WoS

https://github.com/bavla/biblio/tree/master/Pajek/R

Uvod

  • po WoSu iskali keywords "handball"
  • s programom WoS2Pajek predelali v omrežje

Inormacije o ustvarjenih datotekah

number of works      =  56408
number of authors    =  33779
number of journals   =  6798
number of keywords   =  14952
number of records    =  2886 -> št. zadetkov
number of duplicates =  0
clean WoS data  : clean.WoS
works + titles  : titles.csv
works index file: vtxIndex.txt

*** FILES:
year of publication partition: C:/Users/vlado/work2/mark/WoS\Year.clu
described / cited only partition: C:/Users/vlado/work2/mark/WoS\DC.clu
number of pages vector: C:/Users/vlado/work2/mark/WoS\NP.vec
citation network: C:/Users/vlado/work2/mark/WoS\Cite.net
works X journals network: C:/Users/vlado/work2/mark/WoS\WJ.net
works X keywords network: C:/Users/vlado/work2/mark/WoS\WK.net
works X authors  network: C:/Users/vlado/work2/mark/WoS\WA.net
finished: Sat Jun 11 04:30:01 2022

Omrežje cite

  • Preberemo cite
==============================================================================
1. C:\Users\markb\OneDrive\Vlado\WoS novo\Cite.net (56408)
==============================================================================
Number of vertices (n): 56408
----------------------------------------------------------
                                       Arcs          Edges
----------------------------------------------------------
Total number of lines                104188              0
----------------------------------------------------------
Number of loops                           3              0
Number of multiple lines                148              0
----------------------------------------------------------

Density [loops allowed] = 0.00003274
Average Degree = 3.69408595

Prvo dopolnjevanje podatkov

Omrežje dopolnimo tako, da podatkom iz WoS dodamo opise končnih (cited-only) del, na katerih se druga dela zelo pogosto sklicujejo. Podatke o posameznem končnem delu poiščemo v WoSu in shranimo pripadajoči zapis. Če ga tam ne najdemo, ga poiščemo na Googlu in dodamo naslednje podatke

PT J
AU Priimek1, Z
   Priimek2, Z 
   Priimek3, Z
   Priimek4, Z
TI Naslov
SO Revija
LA English
DT Article
DE geslo1; geslo2; geslo3; geslo4
PY leto
VL knjiga
IS zvezek
BP prvastran
EP zadnjastran
ER

Na primer za delo ZAPARTID_I(2009)2:22

** 83 ZAPARTID_I(2009)2:22
** https://opensportssciencesjournal.com/contents/volumes/V2/TOSSJ-2-22/TOSSJ-2-22.pdf
PT J
AU Zapartidis, Ilias
   Vareltzis, Ioannis  
   Gouvali, Marina  
   Kororos, Panagiotis 
TI Physical Fitness and Anthropometric Characteristics in Different Levels of Young Team Handball Players
SO The Open Sports Sciences Journal
LA English
DT Article
DE compare physical fitness; anthropometric characteristics; Greek national team; male; female; young handball players; stature ; hand spread; arm span; ball velocity 
PY 2009
VL 2
BP 22
EP 28
ER

Z ** so označene komentarske vrstice - program WoS2Pajek jih preskoči.

Do seznama končnih del za dopolnitev pridemo takole:

  • določimo vektor vhodnih stopenj v omrežju Cite. Ta pove koliko je sklicev na posamezno delo
  • iz tega vektorja izrežemo končna vozlišča
  • izrežemo še podomrežje končnih vozlišč - usklajenost s podvektorjem za izpis/prikaz
  • z gumbom Info za podvektor prikažemo 300 vozlišč z največjo vrednostjo
preberi omrežje Cite
preberi razbitje DC
Network/Create Vector/Centrality/Degree/Input
Operations/Vector+Partition/Extract Subvector [0]
Operations/Network+Partition/Extract/Subnetwork Induced by Union [0]
Info Vector [+300]

Dobimo naslednjo tabelo

      Rank    Vertex                       Value   Id
--------------------------------------------------------
         1      1730                    269.0000   HEWETT_T(2005)33:492
         2       319                    215.0000   [No title captured]
         3      1597                    193.0000   HEWETT_T(1999)27:699
         4      1722                    174.0000   BODEN_B(2000)23:573
         5      1601                    155.0000   MANDELBA_B(2005)33:1003
         6       283                    140.0000   COHEN_J(1988)2ND ED.:
         7      1015                    130.0000   ARENDT_E(1995)23:694
         8      3895                    126.0000   HEWETT_T(1996)24:765
         9       286                    126.0000   HOPKINS_W(2009)41:3
        10      1595                    111.0000   CARAFFA_A(1996)4:19
        11     11292                    105.0000   MARKOLF_K(1995)13:930
        12      1728                    102.0000   FORD_K(2003)35:1745
        13     11832                     92.0000   AGEL_J(2005)33:524
        14      3646                     82.0000   GRIFFIN_L(2000)8:141
        15     11149                     81.0000   HEIDT_R(2000)28:659
        16      1733                     77.0000   MALINZAK_R(2001)16:438
        17      5926                     77.0000   MYER_G(2005)19:51
        18      4720                     75.0000   SODERMAN_K(2000)8:356
        19       413                     72.0000   VANMECHE_W(1992)14:82
        20     14756                     64.0000   CHAPPELL_J(2002)30:261
        21      1535                     61.0000   VANDEN_T(2007)23:12
        22      1262                     60.0000   LOHMANDE_L(2007)35:1756
        23     11287                     54.0000   BODEN_B(2009)37:252
        24       282                     50.0000   BOSCO_C(1983)50:273
        25     18098                     50.0000   COCHRANE_J(2007)10:96
        26     17471                     50.0000   DEMORAT_G(2004)32:477
        27      2142                     50.0000   HOPKINS_W(2000)30:1
        28      2474                     49.0000   MYER_G(2007)8:39
        29     16687                     49.0000   MCLEAN_S(2004)36:1008
        30        75                     48.0000   VANDEN_T(2004)91:413
        31      1527                     47.0000   HOFF_J(1995)9:255
        32      1526                     47.0000   FLECKSMI_S(1992)6:120
        33      1970                     46.0000   MCLEAN_S(2005)20:863
        34      6721                     46.0000   ZAZULAK_B(2007)35:1123
        35     11837                     46.0000   HOOTMAN_J(2007)42:311
        36      1224                     46.0000   SIBILA_M(2004)36:58
        37     18774                     46.0000   GROOD_E(1983)105:136
        38     16456                     46.0000   MCLEAN_S(2004)19:828
        39     14657                     45.0000   HEWETT_T(2004)86A:1601
        40     26885                     45.0000   LOHMANDE_L(2004)50:3145
        41      1964                     44.0000   BESIER_T(2001)33:1176
        42      1534                     44.0000   VANDEN_T(2003)97:731
        43      1533                     44.0000   VANDEN_T(2004)3:211
        44      1215                     44.0000   KRUSTRUP_P(2003)35:697
        45     14668                     43.0000   MYER_G(2006)20:345
        46     11301                     43.0000   WALDEN_M(2012)344:e3042
        47      6868                     42.0000   MCNAIR_P(1990)103:537
        48      1965                     41.0000   BESIER_T(2001)33:1168
        49      8375                     41.0000   WALDEN_M(2015)49:094573
        50      1614                     40.0000   VANDEN_T(2003)96:423
        51     11841                     40.0000   PATERNO_M(2004)34:305
        52      1974                     39.0000   ALENTORN_E(2009)17:705
        53      1958                     39.0000   KIANI_A(2010)170:43
        54      6852                     39.0000   ARENDT_E(1999)34:86
        55      1536                     39.0000   VANDEN_T(2006)103:503
        56     11288                     38.0000   FLEMING_B(2001)34:163
        57     11151                     38.0000   HUSTON_L(1996)24:427
        58      5382                     38.0000   SHEPPARD_J(2006)24:919
        59      1227                     37.0000   VANDEN_T(2004)18:388
        60     18777                     37.0000   MARKOLF_K(1990)72A:557
        61     18480                     37.0000   LI_G(1999)32:395
        62      1448                     36.0000   VANDEN_T(2009)27:949
        63      7606                     35.0000   FAUL_F(2007)39:175
        64     14677                     35.0000   UHORCHAK_J(2003)31:831
        65      6214                     35.0000   FOSTER_C(2001)15:109
        66       820                     34.0000   MALINA_R(2004):
        67      7763                     33.0000   VERHAGEN_E(2004)32:1385
        68     12653                     33.0000   CHAPPELL_J(2005)33:1022
        69      1538                     33.0000   VANMUIJE_A(1991)2:103
        70      3008                     33.0000   LANDIS_J(1977)33:159
        71      2848                     33.0000   NICHOLLS_J(1989):
        72      2610                     33.0000   SASSI_R(2009)23:1644
        73      1238                     33.0000   FINCH_C(2006)9:3
        74       178                     32.0000   BURKHART_S(2003)19:404
        75      2472                     32.0000   MIRWALD_R(2002)34:689
        76     19714                     32.0000   YU_B(2006)21:297
        77     18483                     32.0000   QUATMAN_C(2009)43:328
        78      2099                     32.0000   SPENCER_M(2005)35:1025
        79     16487                     32.0000   SHIN_C(2011)43:1484
        80      3604                     31.0000   HEWETT_T(2010)5:234
        81       894                     31.0000   WILK_K(2011)39:329
        82      1210                     31.0000   DELAMARC_P(1987)8:55
        83       295                     31.0000   ZAPARTID_I(2009)2:22
        84      4714                     31.0000   LEPHART_S(2002):162
        85      4429                     31.0000   DECKER_M(2003)18:662
        86     16467                     31.0000   PADUA_D(2009)37:1996
        87      3602                     30.0000   CHAPPELL_J(2007)35:235
        88      1715                     30.0000   AAGAARD_P(2002)93:1318
        89      6858                     30.0000   ETTLINGE_C(1995)23:531
        90      6496                     30.0000   MYER_G(2004)39:352
        91     11838                     30.0000   IRMISCHE_B(2004)18:703
        92      4571                     30.0000   WEIR_J(2005)19:231
        93      4393                     30.0000   WU_G(2002)35:543
        94     16454                     30.0000   MCLEAN_S(2007)39:502
        95     16396                     30.0000   CERULLI_G(2003)11:307
        96      1605                     29.0000   DELLO_I(2015)29:835

Odločimo se, da bomo podatke dopolnili z opisi končnih del z vsaj 30 sklici nanje.

Za pridobivanje manjkajočih opisov se izkaže za učinkovito naslednja pot:

  • ker je večina opisov na PubMed, poiščem povezavo z Googlom
  • nato grem v WoS in poiščem opis z ustrezno številko s PubMed
  • najdeni zadetek shranim v Marked list
  • na koncu vse zadetke iz Marked list izvozim na datoteko

Drugo dopolnjevanje

Z dopolnjenimi podatki ustvarimo nove različice omrežij in dobimo novo tabelo končnih del

      Rank    Vertex                       Value   Id
--------------------------------------------------------
         1       315                    227.0000   [No title captured]
         2       281                    140.0000   COHEN_J(1988)2ND ED.:
         3      3609                     94.0000   GRIFFIN_L(2000)8:141
         4      1521                     61.0000   VANDEN_T(2007)23:12
         5        75                     48.0000   VANDEN_T(2004)91:413
         6      1513                     47.0000   FLECKSMI_S(1992)6:120
         7      1520                     44.0000   VANDEN_T(2003)97:731
         8      1519                     44.0000   VANDEN_T(2004)3:211
         9     11091                     41.0000   FERRETTI_A(1992)20:203
        10      8321                     41.0000   WALDEN_M(2015)49:094573
        11      1596                     40.0000   VANDEN_T(2003)96:423
        12      1522                     39.0000   VANDEN_T(2006)103:503
        13     22224                     39.0000   MALONE_T(1993)2:36
        14      1216                     37.0000   VANDEN_T(2004)18:388
        15      1435                     36.0000   VANDEN_T(2009)27:949
        16     18952                     35.0000   WOJTYS_E(1998)26:614
        17     26803                     32.0000   MCLEAN_S(1999)31:959
        18     14586                     31.0000   BERNS_G(1992)10:167
        19     26266                     30.0000   RENSTROM_P(1986)14:83
        20     18685                     30.0000   BELL_A(1990)23:617
        21     16809                     30.0000   LINDENFE_T(1994)22:364
        22      8393                     30.0000   KNAPIK_J(1991)19:76
        23      1587                     29.0000   DELLO_I(2015)29:835
        24     11776                     29.0000   KERNOZEK_T(2005)37:1003

Nekaj del je novih in je potrebno dodati njihove opise. Za nekaj del pa je potrebno popraviti njihove opise tako, da dajo pričakovano kratko ime. Kar nekaj imen del vsebuje prvega avtorja VANDEN_T. Ta izhaja iz van den Tillaar, Roland. Opise "popravimo" tako, da

AU Van Den Tillaar, R

zamenjamo z

** AU Van Den Tillaar, R
AU VANDEN, T

Ponovno ustvarimo omrežja za dopolnjene podatke. Skoraj pri koncu smo:

      Rank    Vertex                       Value   Id
--------------------------------------------------------
         1       313                    227.0000   [No title captured]
         2     11073                     31.0000   GRAY_J(1985)6:314
         3      4664                     30.0000   ZELISKO_J(1982)10:297
         4     17258                     30.0000   BJORDAL_J(1997)25:341
         5     16361                     29.0000   MEYER_E(2008)41:3377
...

Tretje dopolnjevanje

Vsa tri dela najdemo na PubMed in nato v WoS. Ponovno z WoS2Pajek ustvarimo dopolnjena omrežja in dobimo tabelo

      Rank    Vertex                       Value   Id
--------------------------------------------------------
         1       313                    227.0000   [No title captured]
         2     16359                     29.0000   MEYER_E(2008)41:3377
         3      1576                     29.0000   DELLO_I(2015)29:835

Iz poročila programa WoS2Pajek izvemo

>>> 
========= RESTART: C:\Users\vlado\work2\mark\Sco2WoS\WoS2Pajek15.pyw =========

*** WoS2Pajek 1.5 
by V. Batagelj, February 23, 2017 / March 23, 2007

WoS2Pajek parameters
WoS  dir:  C:\Users\vlado\work2\mark\Sco2WoS
ML   dir:  c:\Python27\Lib\site-packages\MontyLingua-2.1\Python
Proj dir:  C:/Users/vlado/work2/mark/Sco2WoS
WoS file:  C:/Users/vlado/work2/mark/Sco2WoS/handball2.WOS
MaxNum  :  200000
step    :  250
ISI name:  False
clean   :  True
keywords:  [True, True, True, True]
titles  :  True
index   :  True

****** MontyLingua v.2.1 ******
...
started: Sat Jun 18 03:32:19 2022

>>>  Handball data from WoS
...
2992 : BERNS_G(1992)10:167  -  2022-06-18 03:34:27.426000
>>> End of processing of WoS file
number of works      =  57422
number of authors    =  34271
number of journals   =  6862
number of keywords   =  15129
number of records    =  2992
number of duplicates =  8
clean WoS data  : clean.WoS
works + titles  : titles.csv
works index file: vtxIndex.txt

*** FILES:
year of publication partition: C:/Users/vlado/work2/mark/Sco2WoS\Year.clu
described / cited only partition: C:/Users/vlado/work2/mark/Sco2WoS\DC.clu
number of pages vector: C:/Users/vlado/work2/mark/Sco2WoS\NP.vec
citation network: C:/Users/vlado/work2/mark/Sco2WoS\Cite.net
works X journals network: C:/Users/vlado/work2/mark/Sco2WoS\WJ.net
works X keywords network: C:/Users/vlado/work2/mark/Sco2WoS\WK.net
works X authors  network: C:/Users/vlado/work2/mark/Sco2WoS\WA.net
finished: Sat Jun 18 03:34:29 2022
time used:  0:02:10.210000
***

Okleščena omrežja

Dela, ki so citirana manj kot k-krat ne štejejmo kot pomembna, zato jih izločimo. Torej ohranimo zadetke in končna dela, na katera obstaja vsaj k sklicov To opisuje ustvarjeno razbitje OK.

Postopek

  • Prebremo omrežje CiteS
  • Preberemo razbitje DC, ki določa zadetke
  • Določimo vektor vhodnih stopenj za CiteS
  • Izberemo k, v našem primeru smo see odločili za k=2
  • Vektor vhodnih stopenj predelamo v razbitje glede na k-1 Vector/make partition/by intervals/selected threshold[k-1] Dobimo razbitje z razredoma 1 in 2, 2 označuje ustrezna vozlišča
  • Predelamo ga v dvojiško razbitje Partition/Binarize partition[2]
  • V dvojiško razbitje predelamo še razbitje DC Partition/Binarize partition[1-*]
  • obe razbitji združimo v OK partitions/max(first, second)
  • preimenujemo razbitje v OK

CiteR

  • Izberemo CiteS
  • Izrežemo z razbitjem OK Operations/Network+partition/extract[1-*]
  • Shrani kot CiteR

WAr

  • najprej iz WA izločimo večkratne povezave in poimenujemo omrežje WAn
  • v info WAn pogledamo število stolpcev (avtorjev)
  • ustvarimo konstantno razbitje za avtorje partition/create constant partition/[Dimensions = 34271(število stolpcev), Constant = 1]
  • združimo razbitji OK in konstantno izberi OK kot prvo in konstantno kot drugo partitions/Fuse
  • izrežemo podomrežje WAr operations/netwrok + partition/extract/[1-*]
  • shranimo omrežje WAr kot omrežje

WJr

  • najprej iz WJ izločimo večkratne povezave in poimenujemo omrežje WJn
  • v info WJn pogledamo število stolpcev (avtorjev)
  • ustvarimo konstantno razbitje za avtorje partition/create constant partition/[Dimensions = 6862(število stolpcev), Constant = 1]
  • združimo razbitji OK in konstantno izberi OK kot prvo in konstantno kot drugo partitions/Fuse
  • izrežemo podomrežje WJr operations/netwrok + partition/extract/[1-*]
  • shranimo omrežje WJr kot omrežje

WJr

  • najprej iz WK izločimo večkratne povezave in poimenujemo omrežje WKn
  • v info WKn pogledamo število stolpcev (avtorjev)
  • ustvarimo konstantno razbitje za avtorje partition/create constant partition/[Dimensions = 15129(število stolpcev), Constant = 1]
  • združimo razbitji OK in konstantno izberi OK kot prvo in konstantno kot drugo partitions/Fuse
  • izrežemo podomrežje WKr operations/netwrok + partition/extract/[1-*]
  • shranimo omrežje WKr kot omrežje

Identifikacija časopisov

V seznamu virov se posamezni časopis pojavlja zapisan (pogosto okrajšano) na več načinov. Na primer Collegium Antropologicum *** Kako razpoznati vse pojavitve imena nekega časopisa kot primerke istega časopisa?

Precej verjetno je, da je eno-značna koda sestavljena iz prvih črk besed, ki sestavljajo ime, enaka za vse primerke. Notranje razlikovanje lahko vnesemo z dvo-značno kodo sestavljeno iz po prvih dveh črk vsake besede (oziroma prve črke, če je beseda enočrkovna - npr. J kot okrajšava za Journal).

Imena časopisov nato uredimo po obeh kodah in s pregledom tako dobljenih skupin "ročno" odločimo katera imena pripadajo istemu časopisu. Pri večjih množicah časopisov se lahko odločimo, da se bomo posvetili le dovolj pomembnim skupinam, na katere je dovolj sklicev.

Pri določanju kod nam bodo prišle prav naslednje funkcije

> firstCh <- function(x) ifelse(nchar(x)>0,substr(x,1,1),"€")
> twoCh <- function(x) substr(x,1,2)
> firstChs <- function(x) paste(firstCh(strsplit(x," ")[1](/bavla/biblio/wiki/1)),collapse="")
> twoChs <- function(x) paste(twoCh(strsplit(x," ")[1](/bavla/biblio/wiki/1)),collapse="")
> s <- "INT J HIST SPORT"
> strsplit(s," ")
[1](/bavla/biblio/wiki/1)
[1] "INT"   "J"     "HIST"  "SPORT"
> firstChs(s)
[1] "IJHS"
> twoChs(s)
[1] "INJHISP"
>

Ustvarjanje razpredelnice s kandidati za ročno prepoznavo imen istega časopisa sem na novo sprogramiral.

# ERjournal.R : Entity Recognition / journals
# http://vladowiki.fmf.uni-lj.si/doku.php?id=ru:dm:sn:jeq
# https://github.com/bavla/biblio/wiki/mark#%C4%8Casopisi
# https://github.com/bavla/biblio/wiki/kodiranje-revij-(journals)
# https://github.com/bavla/biblio/wiki/WoS#identifikacija-%C4%8Dasopisov

# wdir <- "C:/Users/markb/OneDrive/Vlado/Pajek/Novi fajli/Journal"
wdir <- "C:/Users/vlado/work2/mark/Sco2WoS/satur30"

# one- and two- character code functions
firstCh <- function(x) ifelse(nchar(x)>0,substr(x,1,1),"€")
twoCh <- function(x) substr(x,1,2)
firstChs <- function(x) paste(firstCh(strsplit(x," ")[1](/bavla/biblio/wiki/1)),collapse="")
twoChs <- function(x) paste(twoCh(strsplit(x," ")[1](/bavla/biblio/wiki/1)),collapse="")

setwd(wdir)
# in Pajek input WJ.net and from Info
jt <- 64284  # num of vertices in WJ
jf <- 57422  # num of rows/works in WJ
nj <- jt-jf  # num of columns/journals in WJ

# read journal labels
# skip the first two lines + jf row-labels +  *****
A <- read.table("WJ.net",skip=jf+3,nrows=nj-1,stringsAsFactors=FALSE) 
head(A) 
tail(A)
dim(A)
min(A$V1)  # first node:journal
max(A$V1)  # last node:journal

V <- A$V1  # node:journal IDs
T <- A$V2  # journal label
K1 <- sapply(T,firstChs)   # one-character codes
K2 <- sapply(T,twoChs)     # two-character codes

# reorder journals with respect to their (one,two)-codes
K <- paste(K1,K2,sep=":"); k <- order(K)
nr <- length(k)

head(T)

# read weighted indegrees computed in Pajek from Cite*WJ
F <- read.table("widegWciJ.vec",skip=1,stringsAsFactors=FALSE)$V1
tail(F)
length(F)
w <- F[(jf+2):jt]

# reordered journals data frame
Jo <- data.frame(i=k,v=V[k],f=w[k],one=K1[k],two=K2[k],T=T[k])
row.names(Jo) <- 1:nrow(Jo)
write.csv(Jo,file="Jo.csv")

# identify multiple codes classes and compute sums of their frequencies
C <- S <- rep(0,nr)
ena <- ""; dva <- ""; c <- 0
for(i in 1:nr){
  if((Jo$one[i]==ena)&&(Jo$two[i]==dva)) {
    if(C[i-1]==0) {c <- c+1; C[i-1] <- c; S[c] <- Jo$f[i-1]}
    C[i] <- c; S[c] <- S[c] + Jo$f[i]
  } else {ena <- Jo$one[i]; dva <- Jo$two[i]}
}

# exclude classes with the sum bellow a given threshold
OK <- rep(FALSE,nr)
for(i in 1:nr) {
  j <- C[i]
  if(j>0) if(S[j]>=20) {OK[i] <- TRUE}
}
J <- Jo[OK,]
dim(J)
write.csv(J,file="Journals20.csv")

Razpredelnico Journals20.csv moramo "ročno" pregledati.

wdir <- "C:/Users/markb/OneDrive/Vlado/Pajek/Novi fajli/Journal"

setwd(wdir)

d <- read.csv("Jpurnal202.csv", header = TRUE, sep = ";")

dim(d)
head(d)


dt <- d$T
head(dt)

l <- nchar(dt)

s <- d[l<=5,]
head(s)
dim(s)

s
4        52  150 57573   1   A  AP1  APAQ                      Adapted Physical Activity Quarterly (APAQ)        
7        55 2493 59916   1   A  AP4  APES                                                            Apes        
9        57 4039 61462   2   A  AP6 APMIS  Acta Pathologica, Microbiologica, et Immunologica Scandinavica        
17       65 5420 62843   1   A  AR6 ARBOR                                                           Arbor        
83      823  766 58189 110   B  BO1  BONE                                                            Bone        
107    1105 4867 62290   5   C  CL5  CLIN                                                         Clinics        
115    1113 4683 62106   1   C  CO7  CORR                      Clinical Orthopaedics and Related Research        
209    2335 4265 61688   2   H  HA6  HAND                                                            HAND        
215    2341 1760 59183  12   H  HE4 HEART                                                           Heart        
216    2342 3004 60427   4   H  HE5  HERZ                                                            Herz        
232    2529 3692 61115   1   I  IN7   INT                                                               *        
391    4275 6681 64104   1   L  LA8  LAIT                           Le Lait, Dairy Science and Technology        
403    4372 3989 61412   0   M  ME7 MECKA                                                               *        
459    4700 4888 62311   2   N NE18  NEWS                                                The News Journal        
479    4888 4519 61942   1   O  OR3 ORBIT                                                           Orbit        
487    5010  510 57933  29   P  PA1  PAIN                                                            PAIN        
489    5012 1759 59182   2   P  PA3  PACE                    Pacing and Clinical Electrophysiology (PACE)        
496    5019 1786 59209   2   P  PE4 PEERJ                                                           PeerJ        
569    5520   73 57496  48   R  RE1 RETOS                                                           Retos        
576    5527 3294 60717   1   R  RE8 REDIE           REDIE: Revista Electrónica de Investigación Educativa        
579    5530 5282 62705   1   R RE11  REMA                                                            RÉMA        
615    5964  217 57640  92   S  SP1 SPINE                                               The Spine Journal        
624    5972 1880 59303   1   S  SP9  SPSR                               The Soviet and Post Soviet Review        
626    5974 2906 60329   4   S SP11 SPORT                                               The Sport Journal        
634    5983 1965 59388  13   S  ST3 STAPS                                                           Staps

Krčenje omrežja

#končno razbitje časopisov
wdir <- "C:/Users/markb/OneDrive/Vlado/Pajek/Novi fajli/Journal"

setwd(wdir)
jt <- 64284; jf <- 57422 #preberemo iz WJ.net
nj <- jt-jf
D <- read.table("jpurnal2020.csv", sep=";", stringsAsFactors = FALSE, header = TRUE)
tail(D)

head(D)
f <- D[,c(2,3,4,6,7)]
head(f)
names(f) <- c("i","node","f","code","name")
head(f)

clu <- 1:nj; key <- "****" 

for(r in 1:nrow(f)) if(f$code[r]==key) clu[f$node[r]-jf] <- jClass else 
  +   {key <- f$code[r]; jClass <- f$node[r] - jf}

clu[1:20]
length(table(clu))
length(clu)
jouC <- file("revije.clu","w")

cat(paste("*vertices ",nj,sep=""),clu,sep="\n",file=jouC)
close(jouC)

Uporabimo https://github.com/bavla/biblio/wiki/mark#postopek-v-pajku-za-pridobitev-skr%C4%8Denega-omre%C5%BEja za krčenje omrežja

Največkrat citirane revije (najvišje vhodne stopnje WJshrink)

Rank    Vertex                       Value   Id
--------------------------------------------------------
         1     57423                  14142.0000   *****
         2     57520                   1601.0000   J STRENGTH COND RES
         3     57473                   1445.0000   #AM J SPORTS MED
         4     57472                   1095.0000   #BR J SPORTS MED
         5     57488                   1054.0000   #J SPORT SCI
         6     57517                   1010.0000   #MED SCI SPORT EXER
         7     57485                    749.0000   #SPORTS MED
         8     57479                    588.0000   #INT J SPORTS MED
         9     57490                    576.0000   #SCAND J MED SCI SPOR
        10     57477                    427.0000   #J SPORT MED PHYS FIT
        11     57550                    420.0000   J SCI MED SPORT
        12     57452                    419.0000   #EUR J APPL PHYSIOL
        13     57515                    416.0000   J APPL PHYSIOL
        14     57766                    407.0000   #J ATHL TRAINING
        15     57608                    358.0000   #J BIOMECH
        16     57501                    345.0000   #J ORTHOP SPORT PHYS
        17     57586                    328.0000   KNEE SURG SPORT TR A
        18     57497                    319.0000   PERCEPT MOTOR SKILL
        19     57728                    315.0000   #J SPORT EXERCISE PSY
        20     57522                    306.0000   INT J SPORT PHYSIOL
        21     57486                    292.0000   #RES Q EXERCISE SPORT
        22     57809                    282.0000   PSYCHOL SPORT EXERC
        23     57622                    271.0000   J BONE JOINT SURG AM
        24     57483                    254.0000   #J SPORT SCI MED
        25     57546                    253.0000   #J HUM KINET
        26     57534                    249.0000   CLIN J SPORT MED
        27     57709                    214.0000   #EUR J SPORT SCI
        28     57495                    205.0000   #REV PSICOLOGIA DEPOR
        29     57500                    197.0000   #ARTHROSCOPY
        30     57609                    196.0000   #CLIN BIOMECH
        31     57554                    184.0000   #INT J SPORTS PSYCHOL
        32     57545                    168.0000   EUR J APPL PHYSIOL O
        33     57747                    163.0000   J PERS SOC PSYCHOL
        34     57573                    163.0000   #J APPL SPORT PSYCHOL
        35     57581                    161.0000   #SPORT PSYCHOL
        36     57537                    160.0000   INT J PERF ANAL SPOR
        37     57640                    159.0000   #HUM MOVEMENT SCI
        38     57759                    158.0000   GAIT POSTURE
        39     57773                    157.0000   STRENGTH COND J
        40     57595                    155.0000   #CLIN SPORT MED
        41     57481                    149.0000   #INT J SPORTS SCI COA
        42     58472                    148.0000   #J PHYSIOL-LONDON
        43     57930                    141.0000   J SPORT REHABIL
        44     57588                    139.0000   #PHYS SPORTSMED
        45     57950                    138.0000   #J ORTHOPAED RES
        46     57646                    137.0000   PHYS THER SPORT
        47     57589                    137.0000   #ARCH PHYS MED REHAB
        48     57952                    136.0000   #J ELECTROMYOGR KINES
        49     57668                    131.0000   #EXP BRAIN RES
        50     57757                    124.0000   #J APPL BIOMECH

Največkrat citirane revije (najvišje vhodne stopnje WJrshrink)

Rank    Vertex                       Value   Id
--------------------------------------------------------
         1     15936                   2334.0000   *****
         2     15986                    791.0000   #AM J SPORTS MED
         3     16033                    781.0000   J STRENGTH COND RES
         4     16001                    491.0000   #J SPORT SCI
         5     15985                    487.0000   #BR J SPORTS MED
         6     16030                    404.0000   #MED SCI SPORT EXER
         7     15998                    370.0000   #SPORTS MED
         8     16003                    290.0000   #SCAND J MED SCI SPOR
         9     15992                    241.0000   #INT J SPORTS MED
        10     16279                    194.0000   #J ATHL TRAINING
        11     16063                    177.0000   J SCI MED SPORT
        12     15990                    168.0000   #J SPORT MED PHYS FIT
        13     16014                    159.0000   #J ORTHOP SPORT PHYS
        14     16121                    155.0000   #J BIOMECH
        15     16241                    153.0000   #J SPORT EXERCISE PSY
        16     15965                    143.0000   #EUR J APPL PHYSIOL
        17     16035                    136.0000   INT J SPORT PHYSIOL
        18     16099                    133.0000   KNEE SURG SPORT TR A
        19     16059                    131.0000   #J HUM KINET
        20     16322                    117.0000   PSYCHOL SPORT EXERC
        21     15996                    117.0000   #J SPORT SCI MED
        22     15999                    115.0000   #RES Q EXERCISE SPORT
        23     16010                    104.0000   PERCEPT MOTOR SKILL
        24     16047                    102.0000   CLIN J SPORT MED
        25     16028                     98.0000   J APPL PHYSIOL
        26     16222                     95.0000   #EUR J SPORT SCI
        27     16122                     92.0000   #CLIN BIOMECH
        28     16135                     88.0000   J BONE JOINT SURG AM
        29     16008                     82.0000   #REV PSICOLOGIA DEPOR
        30     16067                     79.0000   #INT J SPORTS PSYCHOL
        31     16050                     71.0000   INT J PERF ANAL SPOR
        32     16463                     70.0000   #J ORTHOPAED RES
        33     16270                     67.0000   #J APPL BIOMECH
        34     16096                     67.0000   #COLLEGIUM ANTROPOL
        35     16086                     67.0000   #J APPL SPORT PSYCHOL
        36     16159                     66.0000   PHYS THER SPORT
        37     16443                     66.0000   J SPORT REHABIL
        38     15994                     61.0000   #INT J SPORTS SCI COA
        39     16094                     60.0000   #SPORT PSYCHOL
        40     16578                     60.0000   INT J ENV RES PUB HE
        41     15981                     59.0000   E-BALONMANO COM
        42     16153                     56.0000   #HUM MOVEMENT SCI
        43     16058                     56.0000   EUR J APPL PHYSIOL O
        44     16013                     56.0000   #ARTHROSCOPY
        45     16243                     55.0000   #SPORT BIOMECH
        46     16286                     52.0000   STRENGTH COND J
        47     16124                     51.0000   #SPORTVERLETZ SPORTSC
        48     16281                     49.0000   INT J SPORTS PHYS TH
        49     16023                     48.0000   SPORTS HEALTH
        50     16465                     48.0000   #J ELECTROMYOGR KINES

Najbolj aktivni avtorji

Rank    Vertex                       Value   Id
--------------------------------------------------------
         1     17559                     93.0000   HEWETT_T
         2     17029                     81.0000   MYER_G
         3     17049                     79.0000   BAHR_R
         4     16364                     66.0000   MYKLEBUS_G
         5     16789                     54.0000   HERMASSI_S
         6     16565                     47.0000   BUCHHEIT_M
         7     17658                     46.0000   FORD_K
         8     16910                     44.0000   SCHWESIG_R
         9     16437                     43.0000   CHELLY_M
        10     17889                     40.0000   KROSSHAU_T
        11     17490                     38.0000   GABBETT_T
        12     21519                     37.0000   SHULTZ_S
        13     16323                     36.0000   ENGEBRET_L
        14     16211                     36.0000   KRUSTRUP_P
        15     16188                     33.0000   WAGNER_H
        16     19777                     33.0000   SHEPHARD_R
        17     16000                     31.0000   MENEZES_R
        18     17650                     31.0000   AAGAARD_P
        19     25109                     30.0000   GARRETT_W
        20     15989                     29.0000   VANDEN_T
        21     18801                     28.0000   IBANEZ_S
        22     17321                     28.0000   STEFFEN_K
        23     21808                     27.0000   BEYNNON_B
        24     17924                     27.0000   WILLIAMS_A
        25     16948                     27.0000   YOUNG_W
        26     16931                     27.0000   GONZALEZ_J
        27     16431                     27.0000   BAKER_J
        28     16064                     26.0000   MALINA_R
        29     15938                     26.0000   [ANONYMO
        30     18764                     26.0000   SCHORER_J
        31     19012                     25.0000   GOMEZ-LO_M
        32     16566                     25.0000   CASTAGNA_C
        33     16141                     24.0000   MICHALSI_L
        34     19353                     24.0000   YU_B
        35     18744                     24.0000   LOTURCO_I
        36     18327                     24.0000   CHAMARI_K
        37     16419                     24.0000   BENCKE_J
        38     19252                     23.0000   COOLS_A
        39     17891                     23.0000   MCLEAN_S
        40     17593                     23.0000   DUDA_J
        41     17130                     23.0000   VULETA_D
        42     19335                     22.0000   PADUA_D
        43     16197                     21.0000   BOSCO_C
        44     20866                     21.0000   SOUISSI_N
        45     18693                     21.0000   ABERNETH_B
        46     18685                     21.0000   BEHM_D
        47     16939                     21.0000   KRAEMER_W
        48     16934                     21.0000   HAKKINEN_K
        49     16854                     21.0000   KRISTIAN_E
        50     16302                     20.0000   HASTIE_P

Največkrat citirana dela

Rank    Vertex                       Value   Id
--------------------------------------------------------
         1       499                    303.0000   OLSEN_O(2004)32:1002
         2      1180                    280.0000   HEWETT_T(2005)33:492
         3       228                    278.0000   MYKLEBUS_G(2003)13:71
         4      1047                    209.0000   HEWETT_T(1999)27:699
         5       492                    197.0000   KOGA_H(2010)38:2218
         6      1173                    190.0000   BODEN_B(2000)23:573
         7      1988                    186.0000   KROSSHAU_T(2007)35:359
         8       139                    185.0000   GOROSTIA_E(2005)26:225
         9       167                    168.0000   [No title captured]
        10      1051                    160.0000   MANDELBA_B(2005)33:1003
        11       683                    153.0000   ARENDT_E(1995)23:694
        12      2521                    142.0000   HEWETT_T(1996)24:765
        13       145                    141.0000   KARCHER_C(2014)44:797
        14       134                    140.0000   COHEN_J(1988)2ND ED.:
        15       309                    126.0000   MYKLEBUS_G(1998)8:149
        16       141                    126.0000   HOPKINS_W(2009)41:3
        17       695                    124.0000   OLSEN_O(2005)330:449
        18      6123                    123.0000   MARKOLF_K(1995)13:930
        19        87                    123.0000   GOROSTIA_E(2006)38:357
        20      1046                    123.0000   CARAFFA_A(1996)4:19
        21       125                    121.0000   POVOAS_S(2012)26:3365
        22      1178                    111.0000   FORD_K(2003)35:1745
        23       128                    106.0000   WAGNER_H(2014)13:808
        24       697                    100.0000   PETERSEN_W(2005)125:614
        25      6346                     95.0000   AGEL_J(2005)33:524
        26       720                     94.0000   WEDDERKO_N(1999)9:41
        27      2375                     94.0000   GRIFFIN_L(2000)8:141
        28      1182                     94.0000   MALINZAK_R(2001)16:438
        29       524                     94.0000   MICHALSI_L(2013)34:590
        30       484                     88.0000   GRANADOS_C(2007)28:860
        31      6046                     86.0000   HEIDT_R(2000)28:659
        32      3617                     82.0000   MYER_G(2005)19:51
        33      2943                     79.0000   SODERMAN_K(2000)8:356
        34       191                     78.0000   SEIL_R(1998)26:681
        35       431                     77.0000   MARQUES_M(2006)20:563
        36      3960                     76.0000   HEWETT_T(2009)43:417
        37      7488                     76.0000   CHAPPELL_J(2002)30:261
        38       230                     74.0000   VANMECHE_W(1992)14:82
        39       330                     72.0000   CHAOUACH_A(2009)27:151
        40       433                     70.0000   MARQUES_M(2007)2:414
        41      1315                     67.0000   GILCHRIS_J(2008)36:1476
        42      1985                     66.0000   GRIFFIN_L(2006)34:1512
        43       318                     66.0000   RENSTROM_P(2008)42:394
        44      3739                     65.0000   HEWETT_T(2006)34:490
        45      7448                     63.0000   PFEIFFER_R(2006)88A:1769
        46       839                     62.0000   LOHMANDE_L(2007)35:1756
        47       516                     62.0000   WAGNER_H(2011)10:73
        48      1015                     61.0000   VANDEN_T(2007)23:12
        49       310                     61.0000   MYKLEBUS_G(1997)7:289
        50       308                     61.0000   MOLLER_M(2012)46:531

Število sooavtorjev

 0     1     2     3     4     5     6     7     8     9    10    11    12    13    15    16    17    19    20    21 
 1  13145   404   580   574   469   355   180    99    57    30    18    10     5     1     1     1     1     1     1 
   23    30 
    1     1 

image

Dela z največjim številom soavtorjev

 Rank    Vertex                       Value   Id
--------------------------------------------------------
         1      1985                     30.0000   GRIFFIN_L(2006)34:1512
         2     12642                     23.0000   ZHANG_J(2021)8:690528
         3     13651                     21.0000   MAGNUSSE_R(2010)18:98
         4       318                     20.0000   RENSTROM_P(2008)42:394
         5      2375                     19.0000   GRIFFIN_L(2000)8:141
         6      9402                     17.0000   OGASAWAR_I(2021)18:ijerph18189865
         7     15142                     16.0000   DIAS_E(2021)59:1294
         8      7600                     15.0000   KISS_O(2021)16:0249923
         9     14864                     13.0000   DURMIC_T(2017)243:311
        10     14840                     13.0000   UPHAM_K(2020)17:230

Največkrat uporabljeni keywordi (WKr)

Rank    Vertex                       Value   Id
--------------------------------------------------------
         1     15944                   2888.0000   handball
         2     16015                   2213.0000   study
         3     15994                   2033.0000   player
         4     15946                   1803.0000   sport
         5     15996                   1799.0000   result
         6     16104                   1651.0000   team
         7     16222                   1490.0000   use
         8     16234                   1392.0000   performance
         9     16200                   1208.0000   athlete
        10     16168                   1197.0000   0
        11     16099                   1142.0000   analysis
        12     16088                   1114.0000   difference
        13     16041                   1089.0000   training
        14     16006                   1072.0000   1
        15     16243                   1062.0000   test
        16     16515                   1036.0000   2
        17     16114                   1031.0000   injury
        18     16178                   1026.0000   method
        19     16044                   1014.0000   aim
        20     16165                    994.0000   female
        21     16155                    993.0000   conclusion
        22     16203                    984.0000   p
        23     16280                    974.0000   significant
        24     15943                    940.0000   year
        25     16059                    916.0000   group
        26     16507                    914.0000   effect
        27     16537                    900.0000   3
        28     16043                    891.0000   age
        29     16326                    881.0000   male
        30     16247                    868.0000   elite
        31     16252                    867.0000   level
        32     16157                    848.0000   compare
        33     16251                    824.0000   physical
        34     15993                    817.0000   measure
        35     16463                    806.0000   time
        36     16169                    805.0000   perform
        37     16122                    797.0000   different
        38     16221                    782.0000   increase
        39     16500                    772.0000   <
        40     16275                    750.0000   soccer
        41     16213                    747.0000   high
        42     16529                    722.0000   risk
        43     16332                    713.0000   5
        44     16186                    699.0000   lower
        45     16156                    697.0000   control
        46     16293                    689.0000   4
        47     16037                    680.0000   purpose
        48     16488                    673.0000   strength
        49     16458                    666.0000   6
        50     16531                    663.0000   datum

Main Path

SPC

Main path iz inkscapa

CPM

image

Program za ustvarjanje cvja s net filom

Otoki

  • na CiteR izračunam SPC
  • Network/create partition/islands/generate network with islands[ON]

Izdaje po letih (hits + citations)

image

Izdaje po letih (hits)

image