WoS - bavla/biblio GitHub Wiki
Analiza WoS
https://github.com/bavla/biblio/tree/master/Pajek/R
Uvod
- po WoSu iskali keywords "handball"
- s programom WoS2Pajek predelali v omrežje
Inormacije o ustvarjenih datotekah
number of works = 56408
number of authors = 33779
number of journals = 6798
number of keywords = 14952
number of records = 2886 -> št. zadetkov
number of duplicates = 0
clean WoS data : clean.WoS
works + titles : titles.csv
works index file: vtxIndex.txt
*** FILES:
year of publication partition: C:/Users/vlado/work2/mark/WoS\Year.clu
described / cited only partition: C:/Users/vlado/work2/mark/WoS\DC.clu
number of pages vector: C:/Users/vlado/work2/mark/WoS\NP.vec
citation network: C:/Users/vlado/work2/mark/WoS\Cite.net
works X journals network: C:/Users/vlado/work2/mark/WoS\WJ.net
works X keywords network: C:/Users/vlado/work2/mark/WoS\WK.net
works X authors network: C:/Users/vlado/work2/mark/WoS\WA.net
finished: Sat Jun 11 04:30:01 2022
Omrežje cite
- Preberemo cite
==============================================================================
1. C:\Users\markb\OneDrive\Vlado\WoS novo\Cite.net (56408)
==============================================================================
Number of vertices (n): 56408
----------------------------------------------------------
Arcs Edges
----------------------------------------------------------
Total number of lines 104188 0
----------------------------------------------------------
Number of loops 3 0
Number of multiple lines 148 0
----------------------------------------------------------
Density [loops allowed] = 0.00003274
Average Degree = 3.69408595
Prvo dopolnjevanje podatkov
Omrežje dopolnimo tako, da podatkom iz WoS dodamo opise končnih (cited-only) del, na katerih se druga dela zelo pogosto sklicujejo. Podatke o posameznem končnem delu poiščemo v WoSu in shranimo pripadajoči zapis. Če ga tam ne najdemo, ga poiščemo na Googlu in dodamo naslednje podatke
PT J
AU Priimek1, Z
Priimek2, Z
Priimek3, Z
Priimek4, Z
TI Naslov
SO Revija
LA English
DT Article
DE geslo1; geslo2; geslo3; geslo4
PY leto
VL knjiga
IS zvezek
BP prvastran
EP zadnjastran
ER
Na primer za delo ZAPARTID_I(2009)2:22
** 83 ZAPARTID_I(2009)2:22
** https://opensportssciencesjournal.com/contents/volumes/V2/TOSSJ-2-22/TOSSJ-2-22.pdf
PT J
AU Zapartidis, Ilias
Vareltzis, Ioannis
Gouvali, Marina
Kororos, Panagiotis
TI Physical Fitness and Anthropometric Characteristics in Different Levels of Young Team Handball Players
SO The Open Sports Sciences Journal
LA English
DT Article
DE compare physical fitness; anthropometric characteristics; Greek national team; male; female; young handball players; stature ; hand spread; arm span; ball velocity
PY 2009
VL 2
BP 22
EP 28
ER
Z ** so označene komentarske vrstice - program WoS2Pajek jih preskoči.
Do seznama končnih del za dopolnitev pridemo takole:
- določimo vektor vhodnih stopenj v omrežju Cite. Ta pove koliko je sklicev na posamezno delo
- iz tega vektorja izrežemo končna vozlišča
- izrežemo še podomrežje končnih vozlišč - usklajenost s podvektorjem za izpis/prikaz
- z gumbom Info za podvektor prikažemo 300 vozlišč z največjo vrednostjo
preberi omrežje Cite
preberi razbitje DC
Network/Create Vector/Centrality/Degree/Input
Operations/Vector+Partition/Extract Subvector [0]
Operations/Network+Partition/Extract/Subnetwork Induced by Union [0]
Info Vector [+300]
Dobimo naslednjo tabelo
Rank Vertex Value Id
--------------------------------------------------------
1 1730 269.0000 HEWETT_T(2005)33:492
2 319 215.0000 [No title captured]
3 1597 193.0000 HEWETT_T(1999)27:699
4 1722 174.0000 BODEN_B(2000)23:573
5 1601 155.0000 MANDELBA_B(2005)33:1003
6 283 140.0000 COHEN_J(1988)2ND ED.:
7 1015 130.0000 ARENDT_E(1995)23:694
8 3895 126.0000 HEWETT_T(1996)24:765
9 286 126.0000 HOPKINS_W(2009)41:3
10 1595 111.0000 CARAFFA_A(1996)4:19
11 11292 105.0000 MARKOLF_K(1995)13:930
12 1728 102.0000 FORD_K(2003)35:1745
13 11832 92.0000 AGEL_J(2005)33:524
14 3646 82.0000 GRIFFIN_L(2000)8:141
15 11149 81.0000 HEIDT_R(2000)28:659
16 1733 77.0000 MALINZAK_R(2001)16:438
17 5926 77.0000 MYER_G(2005)19:51
18 4720 75.0000 SODERMAN_K(2000)8:356
19 413 72.0000 VANMECHE_W(1992)14:82
20 14756 64.0000 CHAPPELL_J(2002)30:261
21 1535 61.0000 VANDEN_T(2007)23:12
22 1262 60.0000 LOHMANDE_L(2007)35:1756
23 11287 54.0000 BODEN_B(2009)37:252
24 282 50.0000 BOSCO_C(1983)50:273
25 18098 50.0000 COCHRANE_J(2007)10:96
26 17471 50.0000 DEMORAT_G(2004)32:477
27 2142 50.0000 HOPKINS_W(2000)30:1
28 2474 49.0000 MYER_G(2007)8:39
29 16687 49.0000 MCLEAN_S(2004)36:1008
30 75 48.0000 VANDEN_T(2004)91:413
31 1527 47.0000 HOFF_J(1995)9:255
32 1526 47.0000 FLECKSMI_S(1992)6:120
33 1970 46.0000 MCLEAN_S(2005)20:863
34 6721 46.0000 ZAZULAK_B(2007)35:1123
35 11837 46.0000 HOOTMAN_J(2007)42:311
36 1224 46.0000 SIBILA_M(2004)36:58
37 18774 46.0000 GROOD_E(1983)105:136
38 16456 46.0000 MCLEAN_S(2004)19:828
39 14657 45.0000 HEWETT_T(2004)86A:1601
40 26885 45.0000 LOHMANDE_L(2004)50:3145
41 1964 44.0000 BESIER_T(2001)33:1176
42 1534 44.0000 VANDEN_T(2003)97:731
43 1533 44.0000 VANDEN_T(2004)3:211
44 1215 44.0000 KRUSTRUP_P(2003)35:697
45 14668 43.0000 MYER_G(2006)20:345
46 11301 43.0000 WALDEN_M(2012)344:e3042
47 6868 42.0000 MCNAIR_P(1990)103:537
48 1965 41.0000 BESIER_T(2001)33:1168
49 8375 41.0000 WALDEN_M(2015)49:094573
50 1614 40.0000 VANDEN_T(2003)96:423
51 11841 40.0000 PATERNO_M(2004)34:305
52 1974 39.0000 ALENTORN_E(2009)17:705
53 1958 39.0000 KIANI_A(2010)170:43
54 6852 39.0000 ARENDT_E(1999)34:86
55 1536 39.0000 VANDEN_T(2006)103:503
56 11288 38.0000 FLEMING_B(2001)34:163
57 11151 38.0000 HUSTON_L(1996)24:427
58 5382 38.0000 SHEPPARD_J(2006)24:919
59 1227 37.0000 VANDEN_T(2004)18:388
60 18777 37.0000 MARKOLF_K(1990)72A:557
61 18480 37.0000 LI_G(1999)32:395
62 1448 36.0000 VANDEN_T(2009)27:949
63 7606 35.0000 FAUL_F(2007)39:175
64 14677 35.0000 UHORCHAK_J(2003)31:831
65 6214 35.0000 FOSTER_C(2001)15:109
66 820 34.0000 MALINA_R(2004):
67 7763 33.0000 VERHAGEN_E(2004)32:1385
68 12653 33.0000 CHAPPELL_J(2005)33:1022
69 1538 33.0000 VANMUIJE_A(1991)2:103
70 3008 33.0000 LANDIS_J(1977)33:159
71 2848 33.0000 NICHOLLS_J(1989):
72 2610 33.0000 SASSI_R(2009)23:1644
73 1238 33.0000 FINCH_C(2006)9:3
74 178 32.0000 BURKHART_S(2003)19:404
75 2472 32.0000 MIRWALD_R(2002)34:689
76 19714 32.0000 YU_B(2006)21:297
77 18483 32.0000 QUATMAN_C(2009)43:328
78 2099 32.0000 SPENCER_M(2005)35:1025
79 16487 32.0000 SHIN_C(2011)43:1484
80 3604 31.0000 HEWETT_T(2010)5:234
81 894 31.0000 WILK_K(2011)39:329
82 1210 31.0000 DELAMARC_P(1987)8:55
83 295 31.0000 ZAPARTID_I(2009)2:22
84 4714 31.0000 LEPHART_S(2002):162
85 4429 31.0000 DECKER_M(2003)18:662
86 16467 31.0000 PADUA_D(2009)37:1996
87 3602 30.0000 CHAPPELL_J(2007)35:235
88 1715 30.0000 AAGAARD_P(2002)93:1318
89 6858 30.0000 ETTLINGE_C(1995)23:531
90 6496 30.0000 MYER_G(2004)39:352
91 11838 30.0000 IRMISCHE_B(2004)18:703
92 4571 30.0000 WEIR_J(2005)19:231
93 4393 30.0000 WU_G(2002)35:543
94 16454 30.0000 MCLEAN_S(2007)39:502
95 16396 30.0000 CERULLI_G(2003)11:307
96 1605 29.0000 DELLO_I(2015)29:835
Odločimo se, da bomo podatke dopolnili z opisi končnih del z vsaj 30 sklici nanje.
Za pridobivanje manjkajočih opisov se izkaže za učinkovito naslednja pot:
- ker je večina opisov na PubMed, poiščem povezavo z Googlom
- nato grem v WoS in poiščem opis z ustrezno številko s PubMed
- najdeni zadetek shranim v Marked list
- na koncu vse zadetke iz Marked list izvozim na datoteko
Drugo dopolnjevanje
Z dopolnjenimi podatki ustvarimo nove različice omrežij in dobimo novo tabelo končnih del
Rank Vertex Value Id
--------------------------------------------------------
1 315 227.0000 [No title captured]
2 281 140.0000 COHEN_J(1988)2ND ED.:
3 3609 94.0000 GRIFFIN_L(2000)8:141
4 1521 61.0000 VANDEN_T(2007)23:12
5 75 48.0000 VANDEN_T(2004)91:413
6 1513 47.0000 FLECKSMI_S(1992)6:120
7 1520 44.0000 VANDEN_T(2003)97:731
8 1519 44.0000 VANDEN_T(2004)3:211
9 11091 41.0000 FERRETTI_A(1992)20:203
10 8321 41.0000 WALDEN_M(2015)49:094573
11 1596 40.0000 VANDEN_T(2003)96:423
12 1522 39.0000 VANDEN_T(2006)103:503
13 22224 39.0000 MALONE_T(1993)2:36
14 1216 37.0000 VANDEN_T(2004)18:388
15 1435 36.0000 VANDEN_T(2009)27:949
16 18952 35.0000 WOJTYS_E(1998)26:614
17 26803 32.0000 MCLEAN_S(1999)31:959
18 14586 31.0000 BERNS_G(1992)10:167
19 26266 30.0000 RENSTROM_P(1986)14:83
20 18685 30.0000 BELL_A(1990)23:617
21 16809 30.0000 LINDENFE_T(1994)22:364
22 8393 30.0000 KNAPIK_J(1991)19:76
23 1587 29.0000 DELLO_I(2015)29:835
24 11776 29.0000 KERNOZEK_T(2005)37:1003
Nekaj del je novih in je potrebno dodati njihove opise. Za nekaj del pa je potrebno popraviti njihove opise tako, da dajo pričakovano kratko ime. Kar nekaj imen del vsebuje prvega avtorja VANDEN_T. Ta izhaja iz van den Tillaar, Roland. Opise "popravimo" tako, da
AU Van Den Tillaar, R
zamenjamo z
** AU Van Den Tillaar, R
AU VANDEN, T
Ponovno ustvarimo omrežja za dopolnjene podatke. Skoraj pri koncu smo:
Rank Vertex Value Id
--------------------------------------------------------
1 313 227.0000 [No title captured]
2 11073 31.0000 GRAY_J(1985)6:314
3 4664 30.0000 ZELISKO_J(1982)10:297
4 17258 30.0000 BJORDAL_J(1997)25:341
5 16361 29.0000 MEYER_E(2008)41:3377
...
Tretje dopolnjevanje
Vsa tri dela najdemo na PubMed in nato v WoS. Ponovno z WoS2Pajek ustvarimo dopolnjena omrežja in dobimo tabelo
Rank Vertex Value Id
--------------------------------------------------------
1 313 227.0000 [No title captured]
2 16359 29.0000 MEYER_E(2008)41:3377
3 1576 29.0000 DELLO_I(2015)29:835
Iz poročila programa WoS2Pajek izvemo
>>>
========= RESTART: C:\Users\vlado\work2\mark\Sco2WoS\WoS2Pajek15.pyw =========
*** WoS2Pajek 1.5
by V. Batagelj, February 23, 2017 / March 23, 2007
WoS2Pajek parameters
WoS dir: C:\Users\vlado\work2\mark\Sco2WoS
ML dir: c:\Python27\Lib\site-packages\MontyLingua-2.1\Python
Proj dir: C:/Users/vlado/work2/mark/Sco2WoS
WoS file: C:/Users/vlado/work2/mark/Sco2WoS/handball2.WOS
MaxNum : 200000
step : 250
ISI name: False
clean : True
keywords: [True, True, True, True]
titles : True
index : True
****** MontyLingua v.2.1 ******
...
started: Sat Jun 18 03:32:19 2022
>>> Handball data from WoS
...
2992 : BERNS_G(1992)10:167 - 2022-06-18 03:34:27.426000
>>> End of processing of WoS file
number of works = 57422
number of authors = 34271
number of journals = 6862
number of keywords = 15129
number of records = 2992
number of duplicates = 8
clean WoS data : clean.WoS
works + titles : titles.csv
works index file: vtxIndex.txt
*** FILES:
year of publication partition: C:/Users/vlado/work2/mark/Sco2WoS\Year.clu
described / cited only partition: C:/Users/vlado/work2/mark/Sco2WoS\DC.clu
number of pages vector: C:/Users/vlado/work2/mark/Sco2WoS\NP.vec
citation network: C:/Users/vlado/work2/mark/Sco2WoS\Cite.net
works X journals network: C:/Users/vlado/work2/mark/Sco2WoS\WJ.net
works X keywords network: C:/Users/vlado/work2/mark/Sco2WoS\WK.net
works X authors network: C:/Users/vlado/work2/mark/Sco2WoS\WA.net
finished: Sat Jun 18 03:34:29 2022
time used: 0:02:10.210000
***
Okleščena omrežja
Dela, ki so citirana manj kot k-krat ne štejejmo kot pomembna, zato jih izločimo. Torej ohranimo zadetke in končna dela, na katera obstaja vsaj k sklicov To opisuje ustvarjeno razbitje OK.
Postopek
- Prebremo omrežje CiteS
- Preberemo razbitje DC, ki določa zadetke
- Določimo vektor vhodnih stopenj za CiteS
- Izberemo k, v našem primeru smo see odločili za k=2
- Vektor vhodnih stopenj predelamo v razbitje glede na k-1 Vector/make partition/by intervals/selected threshold[k-1] Dobimo razbitje z razredoma 1 in 2, 2 označuje ustrezna vozlišča
- Predelamo ga v dvojiško razbitje Partition/Binarize partition[2]
- V dvojiško razbitje predelamo še razbitje DC Partition/Binarize partition[1-*]
- obe razbitji združimo v OK partitions/max(first, second)
- preimenujemo razbitje v OK
CiteR
- Izberemo CiteS
- Izrežemo z razbitjem OK Operations/Network+partition/extract[1-*]
- Shrani kot CiteR
WAr
- najprej iz WA izločimo večkratne povezave in poimenujemo omrežje WAn
- v info WAn pogledamo število stolpcev (avtorjev)
- ustvarimo konstantno razbitje za avtorje partition/create constant partition/[Dimensions = 34271(število stolpcev), Constant = 1]
- združimo razbitji OK in konstantno izberi OK kot prvo in konstantno kot drugo partitions/Fuse
- izrežemo podomrežje WAr operations/netwrok + partition/extract/[1-*]
- shranimo omrežje WAr kot omrežje
WJr
- najprej iz WJ izločimo večkratne povezave in poimenujemo omrežje WJn
- v info WJn pogledamo število stolpcev (avtorjev)
- ustvarimo konstantno razbitje za avtorje partition/create constant partition/[Dimensions = 6862(število stolpcev), Constant = 1]
- združimo razbitji OK in konstantno izberi OK kot prvo in konstantno kot drugo partitions/Fuse
- izrežemo podomrežje WJr operations/netwrok + partition/extract/[1-*]
- shranimo omrežje WJr kot omrežje
WJr
- najprej iz WK izločimo večkratne povezave in poimenujemo omrežje WKn
- v info WKn pogledamo število stolpcev (avtorjev)
- ustvarimo konstantno razbitje za avtorje partition/create constant partition/[Dimensions = 15129(število stolpcev), Constant = 1]
- združimo razbitji OK in konstantno izberi OK kot prvo in konstantno kot drugo partitions/Fuse
- izrežemo podomrežje WKr operations/netwrok + partition/extract/[1-*]
- shranimo omrežje WKr kot omrežje
Identifikacija časopisov
V seznamu virov se posamezni časopis pojavlja zapisan (pogosto okrajšano) na več načinov. Na primer Collegium Antropologicum *** Kako razpoznati vse pojavitve imena nekega časopisa kot primerke istega časopisa?
Precej verjetno je, da je eno-značna koda sestavljena iz prvih črk besed, ki sestavljajo ime, enaka za vse primerke. Notranje razlikovanje lahko vnesemo z dvo-značno kodo sestavljeno iz po prvih dveh črk vsake besede (oziroma prve črke, če je beseda enočrkovna - npr. J kot okrajšava za Journal).
Imena časopisov nato uredimo po obeh kodah in s pregledom tako dobljenih skupin "ročno" odločimo katera imena pripadajo istemu časopisu. Pri večjih množicah časopisov se lahko odločimo, da se bomo posvetili le dovolj pomembnim skupinam, na katere je dovolj sklicev.
Pri določanju kod nam bodo prišle prav naslednje funkcije
> firstCh <- function(x) ifelse(nchar(x)>0,substr(x,1,1),"€")
> twoCh <- function(x) substr(x,1,2)
> firstChs <- function(x) paste(firstCh(strsplit(x," ")[1](/bavla/biblio/wiki/1)),collapse="")
> twoChs <- function(x) paste(twoCh(strsplit(x," ")[1](/bavla/biblio/wiki/1)),collapse="")
> s <- "INT J HIST SPORT"
> strsplit(s," ")
[1](/bavla/biblio/wiki/1)
[1] "INT" "J" "HIST" "SPORT"
> firstChs(s)
[1] "IJHS"
> twoChs(s)
[1] "INJHISP"
>
Ustvarjanje razpredelnice s kandidati za ročno prepoznavo imen istega časopisa sem na novo sprogramiral.
# ERjournal.R : Entity Recognition / journals
# http://vladowiki.fmf.uni-lj.si/doku.php?id=ru:dm:sn:jeq
# https://github.com/bavla/biblio/wiki/mark#%C4%8Casopisi
# https://github.com/bavla/biblio/wiki/kodiranje-revij-(journals)
# https://github.com/bavla/biblio/wiki/WoS#identifikacija-%C4%8Dasopisov
# wdir <- "C:/Users/markb/OneDrive/Vlado/Pajek/Novi fajli/Journal"
wdir <- "C:/Users/vlado/work2/mark/Sco2WoS/satur30"
# one- and two- character code functions
firstCh <- function(x) ifelse(nchar(x)>0,substr(x,1,1),"€")
twoCh <- function(x) substr(x,1,2)
firstChs <- function(x) paste(firstCh(strsplit(x," ")[1](/bavla/biblio/wiki/1)),collapse="")
twoChs <- function(x) paste(twoCh(strsplit(x," ")[1](/bavla/biblio/wiki/1)),collapse="")
setwd(wdir)
# in Pajek input WJ.net and from Info
jt <- 64284 # num of vertices in WJ
jf <- 57422 # num of rows/works in WJ
nj <- jt-jf # num of columns/journals in WJ
# read journal labels
# skip the first two lines + jf row-labels + *****
A <- read.table("WJ.net",skip=jf+3,nrows=nj-1,stringsAsFactors=FALSE)
head(A)
tail(A)
dim(A)
min(A$V1) # first node:journal
max(A$V1) # last node:journal
V <- A$V1 # node:journal IDs
T <- A$V2 # journal label
K1 <- sapply(T,firstChs) # one-character codes
K2 <- sapply(T,twoChs) # two-character codes
# reorder journals with respect to their (one,two)-codes
K <- paste(K1,K2,sep=":"); k <- order(K)
nr <- length(k)
head(T)
# read weighted indegrees computed in Pajek from Cite*WJ
F <- read.table("widegWciJ.vec",skip=1,stringsAsFactors=FALSE)$V1
tail(F)
length(F)
w <- F[(jf+2):jt]
# reordered journals data frame
Jo <- data.frame(i=k,v=V[k],f=w[k],one=K1[k],two=K2[k],T=T[k])
row.names(Jo) <- 1:nrow(Jo)
write.csv(Jo,file="Jo.csv")
# identify multiple codes classes and compute sums of their frequencies
C <- S <- rep(0,nr)
ena <- ""; dva <- ""; c <- 0
for(i in 1:nr){
if((Jo$one[i]==ena)&&(Jo$two[i]==dva)) {
if(C[i-1]==0) {c <- c+1; C[i-1] <- c; S[c] <- Jo$f[i-1]}
C[i] <- c; S[c] <- S[c] + Jo$f[i]
} else {ena <- Jo$one[i]; dva <- Jo$two[i]}
}
# exclude classes with the sum bellow a given threshold
OK <- rep(FALSE,nr)
for(i in 1:nr) {
j <- C[i]
if(j>0) if(S[j]>=20) {OK[i] <- TRUE}
}
J <- Jo[OK,]
dim(J)
write.csv(J,file="Journals20.csv")
Razpredelnico Journals20.csv moramo "ročno" pregledati.
wdir <- "C:/Users/markb/OneDrive/Vlado/Pajek/Novi fajli/Journal"
setwd(wdir)
d <- read.csv("Jpurnal202.csv", header = TRUE, sep = ";")
dim(d)
head(d)
dt <- d$T
head(dt)
l <- nchar(dt)
s <- d[l<=5,]
head(s)
dim(s)
s
4 52 150 57573 1 A AP1 APAQ Adapted Physical Activity Quarterly (APAQ)
7 55 2493 59916 1 A AP4 APES Apes
9 57 4039 61462 2 A AP6 APMIS Acta Pathologica, Microbiologica, et Immunologica Scandinavica
17 65 5420 62843 1 A AR6 ARBOR Arbor
83 823 766 58189 110 B BO1 BONE Bone
107 1105 4867 62290 5 C CL5 CLIN Clinics
115 1113 4683 62106 1 C CO7 CORR Clinical Orthopaedics and Related Research
209 2335 4265 61688 2 H HA6 HAND HAND
215 2341 1760 59183 12 H HE4 HEART Heart
216 2342 3004 60427 4 H HE5 HERZ Herz
232 2529 3692 61115 1 I IN7 INT *
391 4275 6681 64104 1 L LA8 LAIT Le Lait, Dairy Science and Technology
403 4372 3989 61412 0 M ME7 MECKA *
459 4700 4888 62311 2 N NE18 NEWS The News Journal
479 4888 4519 61942 1 O OR3 ORBIT Orbit
487 5010 510 57933 29 P PA1 PAIN PAIN
489 5012 1759 59182 2 P PA3 PACE Pacing and Clinical Electrophysiology (PACE)
496 5019 1786 59209 2 P PE4 PEERJ PeerJ
569 5520 73 57496 48 R RE1 RETOS Retos
576 5527 3294 60717 1 R RE8 REDIE REDIE: Revista Electrónica de Investigación Educativa
579 5530 5282 62705 1 R RE11 REMA RÉMA
615 5964 217 57640 92 S SP1 SPINE The Spine Journal
624 5972 1880 59303 1 S SP9 SPSR The Soviet and Post Soviet Review
626 5974 2906 60329 4 S SP11 SPORT The Sport Journal
634 5983 1965 59388 13 S ST3 STAPS Staps
Krčenje omrežja
#končno razbitje časopisov
wdir <- "C:/Users/markb/OneDrive/Vlado/Pajek/Novi fajli/Journal"
setwd(wdir)
jt <- 64284; jf <- 57422 #preberemo iz WJ.net
nj <- jt-jf
D <- read.table("jpurnal2020.csv", sep=";", stringsAsFactors = FALSE, header = TRUE)
tail(D)
head(D)
f <- D[,c(2,3,4,6,7)]
head(f)
names(f) <- c("i","node","f","code","name")
head(f)
clu <- 1:nj; key <- "****"
for(r in 1:nrow(f)) if(f$code[r]==key) clu[f$node[r]-jf] <- jClass else
+ {key <- f$code[r]; jClass <- f$node[r] - jf}
clu[1:20]
length(table(clu))
length(clu)
jouC <- file("revije.clu","w")
cat(paste("*vertices ",nj,sep=""),clu,sep="\n",file=jouC)
close(jouC)
Uporabimo https://github.com/bavla/biblio/wiki/mark#postopek-v-pajku-za-pridobitev-skr%C4%8Denega-omre%C5%BEja za krčenje omrežja
Največkrat citirane revije (najvišje vhodne stopnje WJshrink)
Rank Vertex Value Id
--------------------------------------------------------
1 57423 14142.0000 *****
2 57520 1601.0000 J STRENGTH COND RES
3 57473 1445.0000 #AM J SPORTS MED
4 57472 1095.0000 #BR J SPORTS MED
5 57488 1054.0000 #J SPORT SCI
6 57517 1010.0000 #MED SCI SPORT EXER
7 57485 749.0000 #SPORTS MED
8 57479 588.0000 #INT J SPORTS MED
9 57490 576.0000 #SCAND J MED SCI SPOR
10 57477 427.0000 #J SPORT MED PHYS FIT
11 57550 420.0000 J SCI MED SPORT
12 57452 419.0000 #EUR J APPL PHYSIOL
13 57515 416.0000 J APPL PHYSIOL
14 57766 407.0000 #J ATHL TRAINING
15 57608 358.0000 #J BIOMECH
16 57501 345.0000 #J ORTHOP SPORT PHYS
17 57586 328.0000 KNEE SURG SPORT TR A
18 57497 319.0000 PERCEPT MOTOR SKILL
19 57728 315.0000 #J SPORT EXERCISE PSY
20 57522 306.0000 INT J SPORT PHYSIOL
21 57486 292.0000 #RES Q EXERCISE SPORT
22 57809 282.0000 PSYCHOL SPORT EXERC
23 57622 271.0000 J BONE JOINT SURG AM
24 57483 254.0000 #J SPORT SCI MED
25 57546 253.0000 #J HUM KINET
26 57534 249.0000 CLIN J SPORT MED
27 57709 214.0000 #EUR J SPORT SCI
28 57495 205.0000 #REV PSICOLOGIA DEPOR
29 57500 197.0000 #ARTHROSCOPY
30 57609 196.0000 #CLIN BIOMECH
31 57554 184.0000 #INT J SPORTS PSYCHOL
32 57545 168.0000 EUR J APPL PHYSIOL O
33 57747 163.0000 J PERS SOC PSYCHOL
34 57573 163.0000 #J APPL SPORT PSYCHOL
35 57581 161.0000 #SPORT PSYCHOL
36 57537 160.0000 INT J PERF ANAL SPOR
37 57640 159.0000 #HUM MOVEMENT SCI
38 57759 158.0000 GAIT POSTURE
39 57773 157.0000 STRENGTH COND J
40 57595 155.0000 #CLIN SPORT MED
41 57481 149.0000 #INT J SPORTS SCI COA
42 58472 148.0000 #J PHYSIOL-LONDON
43 57930 141.0000 J SPORT REHABIL
44 57588 139.0000 #PHYS SPORTSMED
45 57950 138.0000 #J ORTHOPAED RES
46 57646 137.0000 PHYS THER SPORT
47 57589 137.0000 #ARCH PHYS MED REHAB
48 57952 136.0000 #J ELECTROMYOGR KINES
49 57668 131.0000 #EXP BRAIN RES
50 57757 124.0000 #J APPL BIOMECH
Največkrat citirane revije (najvišje vhodne stopnje WJrshrink)
Rank Vertex Value Id
--------------------------------------------------------
1 15936 2334.0000 *****
2 15986 791.0000 #AM J SPORTS MED
3 16033 781.0000 J STRENGTH COND RES
4 16001 491.0000 #J SPORT SCI
5 15985 487.0000 #BR J SPORTS MED
6 16030 404.0000 #MED SCI SPORT EXER
7 15998 370.0000 #SPORTS MED
8 16003 290.0000 #SCAND J MED SCI SPOR
9 15992 241.0000 #INT J SPORTS MED
10 16279 194.0000 #J ATHL TRAINING
11 16063 177.0000 J SCI MED SPORT
12 15990 168.0000 #J SPORT MED PHYS FIT
13 16014 159.0000 #J ORTHOP SPORT PHYS
14 16121 155.0000 #J BIOMECH
15 16241 153.0000 #J SPORT EXERCISE PSY
16 15965 143.0000 #EUR J APPL PHYSIOL
17 16035 136.0000 INT J SPORT PHYSIOL
18 16099 133.0000 KNEE SURG SPORT TR A
19 16059 131.0000 #J HUM KINET
20 16322 117.0000 PSYCHOL SPORT EXERC
21 15996 117.0000 #J SPORT SCI MED
22 15999 115.0000 #RES Q EXERCISE SPORT
23 16010 104.0000 PERCEPT MOTOR SKILL
24 16047 102.0000 CLIN J SPORT MED
25 16028 98.0000 J APPL PHYSIOL
26 16222 95.0000 #EUR J SPORT SCI
27 16122 92.0000 #CLIN BIOMECH
28 16135 88.0000 J BONE JOINT SURG AM
29 16008 82.0000 #REV PSICOLOGIA DEPOR
30 16067 79.0000 #INT J SPORTS PSYCHOL
31 16050 71.0000 INT J PERF ANAL SPOR
32 16463 70.0000 #J ORTHOPAED RES
33 16270 67.0000 #J APPL BIOMECH
34 16096 67.0000 #COLLEGIUM ANTROPOL
35 16086 67.0000 #J APPL SPORT PSYCHOL
36 16159 66.0000 PHYS THER SPORT
37 16443 66.0000 J SPORT REHABIL
38 15994 61.0000 #INT J SPORTS SCI COA
39 16094 60.0000 #SPORT PSYCHOL
40 16578 60.0000 INT J ENV RES PUB HE
41 15981 59.0000 E-BALONMANO COM
42 16153 56.0000 #HUM MOVEMENT SCI
43 16058 56.0000 EUR J APPL PHYSIOL O
44 16013 56.0000 #ARTHROSCOPY
45 16243 55.0000 #SPORT BIOMECH
46 16286 52.0000 STRENGTH COND J
47 16124 51.0000 #SPORTVERLETZ SPORTSC
48 16281 49.0000 INT J SPORTS PHYS TH
49 16023 48.0000 SPORTS HEALTH
50 16465 48.0000 #J ELECTROMYOGR KINES
Najbolj aktivni avtorji
Rank Vertex Value Id
--------------------------------------------------------
1 17559 93.0000 HEWETT_T
2 17029 81.0000 MYER_G
3 17049 79.0000 BAHR_R
4 16364 66.0000 MYKLEBUS_G
5 16789 54.0000 HERMASSI_S
6 16565 47.0000 BUCHHEIT_M
7 17658 46.0000 FORD_K
8 16910 44.0000 SCHWESIG_R
9 16437 43.0000 CHELLY_M
10 17889 40.0000 KROSSHAU_T
11 17490 38.0000 GABBETT_T
12 21519 37.0000 SHULTZ_S
13 16323 36.0000 ENGEBRET_L
14 16211 36.0000 KRUSTRUP_P
15 16188 33.0000 WAGNER_H
16 19777 33.0000 SHEPHARD_R
17 16000 31.0000 MENEZES_R
18 17650 31.0000 AAGAARD_P
19 25109 30.0000 GARRETT_W
20 15989 29.0000 VANDEN_T
21 18801 28.0000 IBANEZ_S
22 17321 28.0000 STEFFEN_K
23 21808 27.0000 BEYNNON_B
24 17924 27.0000 WILLIAMS_A
25 16948 27.0000 YOUNG_W
26 16931 27.0000 GONZALEZ_J
27 16431 27.0000 BAKER_J
28 16064 26.0000 MALINA_R
29 15938 26.0000 [ANONYMO
30 18764 26.0000 SCHORER_J
31 19012 25.0000 GOMEZ-LO_M
32 16566 25.0000 CASTAGNA_C
33 16141 24.0000 MICHALSI_L
34 19353 24.0000 YU_B
35 18744 24.0000 LOTURCO_I
36 18327 24.0000 CHAMARI_K
37 16419 24.0000 BENCKE_J
38 19252 23.0000 COOLS_A
39 17891 23.0000 MCLEAN_S
40 17593 23.0000 DUDA_J
41 17130 23.0000 VULETA_D
42 19335 22.0000 PADUA_D
43 16197 21.0000 BOSCO_C
44 20866 21.0000 SOUISSI_N
45 18693 21.0000 ABERNETH_B
46 18685 21.0000 BEHM_D
47 16939 21.0000 KRAEMER_W
48 16934 21.0000 HAKKINEN_K
49 16854 21.0000 KRISTIAN_E
50 16302 20.0000 HASTIE_P
Največkrat citirana dela
Rank Vertex Value Id
--------------------------------------------------------
1 499 303.0000 OLSEN_O(2004)32:1002
2 1180 280.0000 HEWETT_T(2005)33:492
3 228 278.0000 MYKLEBUS_G(2003)13:71
4 1047 209.0000 HEWETT_T(1999)27:699
5 492 197.0000 KOGA_H(2010)38:2218
6 1173 190.0000 BODEN_B(2000)23:573
7 1988 186.0000 KROSSHAU_T(2007)35:359
8 139 185.0000 GOROSTIA_E(2005)26:225
9 167 168.0000 [No title captured]
10 1051 160.0000 MANDELBA_B(2005)33:1003
11 683 153.0000 ARENDT_E(1995)23:694
12 2521 142.0000 HEWETT_T(1996)24:765
13 145 141.0000 KARCHER_C(2014)44:797
14 134 140.0000 COHEN_J(1988)2ND ED.:
15 309 126.0000 MYKLEBUS_G(1998)8:149
16 141 126.0000 HOPKINS_W(2009)41:3
17 695 124.0000 OLSEN_O(2005)330:449
18 6123 123.0000 MARKOLF_K(1995)13:930
19 87 123.0000 GOROSTIA_E(2006)38:357
20 1046 123.0000 CARAFFA_A(1996)4:19
21 125 121.0000 POVOAS_S(2012)26:3365
22 1178 111.0000 FORD_K(2003)35:1745
23 128 106.0000 WAGNER_H(2014)13:808
24 697 100.0000 PETERSEN_W(2005)125:614
25 6346 95.0000 AGEL_J(2005)33:524
26 720 94.0000 WEDDERKO_N(1999)9:41
27 2375 94.0000 GRIFFIN_L(2000)8:141
28 1182 94.0000 MALINZAK_R(2001)16:438
29 524 94.0000 MICHALSI_L(2013)34:590
30 484 88.0000 GRANADOS_C(2007)28:860
31 6046 86.0000 HEIDT_R(2000)28:659
32 3617 82.0000 MYER_G(2005)19:51
33 2943 79.0000 SODERMAN_K(2000)8:356
34 191 78.0000 SEIL_R(1998)26:681
35 431 77.0000 MARQUES_M(2006)20:563
36 3960 76.0000 HEWETT_T(2009)43:417
37 7488 76.0000 CHAPPELL_J(2002)30:261
38 230 74.0000 VANMECHE_W(1992)14:82
39 330 72.0000 CHAOUACH_A(2009)27:151
40 433 70.0000 MARQUES_M(2007)2:414
41 1315 67.0000 GILCHRIS_J(2008)36:1476
42 1985 66.0000 GRIFFIN_L(2006)34:1512
43 318 66.0000 RENSTROM_P(2008)42:394
44 3739 65.0000 HEWETT_T(2006)34:490
45 7448 63.0000 PFEIFFER_R(2006)88A:1769
46 839 62.0000 LOHMANDE_L(2007)35:1756
47 516 62.0000 WAGNER_H(2011)10:73
48 1015 61.0000 VANDEN_T(2007)23:12
49 310 61.0000 MYKLEBUS_G(1997)7:289
50 308 61.0000 MOLLER_M(2012)46:531
Število sooavtorjev
0 1 2 3 4 5 6 7 8 9 10 11 12 13 15 16 17 19 20 21
1 13145 404 580 574 469 355 180 99 57 30 18 10 5 1 1 1 1 1 1
23 30
1 1

Dela z največjim številom soavtorjev
Rank Vertex Value Id
--------------------------------------------------------
1 1985 30.0000 GRIFFIN_L(2006)34:1512
2 12642 23.0000 ZHANG_J(2021)8:690528
3 13651 21.0000 MAGNUSSE_R(2010)18:98
4 318 20.0000 RENSTROM_P(2008)42:394
5 2375 19.0000 GRIFFIN_L(2000)8:141
6 9402 17.0000 OGASAWAR_I(2021)18:ijerph18189865
7 15142 16.0000 DIAS_E(2021)59:1294
8 7600 15.0000 KISS_O(2021)16:0249923
9 14864 13.0000 DURMIC_T(2017)243:311
10 14840 13.0000 UPHAM_K(2020)17:230
Največkrat uporabljeni keywordi (WKr)
Rank Vertex Value Id
--------------------------------------------------------
1 15944 2888.0000 handball
2 16015 2213.0000 study
3 15994 2033.0000 player
4 15946 1803.0000 sport
5 15996 1799.0000 result
6 16104 1651.0000 team
7 16222 1490.0000 use
8 16234 1392.0000 performance
9 16200 1208.0000 athlete
10 16168 1197.0000 0
11 16099 1142.0000 analysis
12 16088 1114.0000 difference
13 16041 1089.0000 training
14 16006 1072.0000 1
15 16243 1062.0000 test
16 16515 1036.0000 2
17 16114 1031.0000 injury
18 16178 1026.0000 method
19 16044 1014.0000 aim
20 16165 994.0000 female
21 16155 993.0000 conclusion
22 16203 984.0000 p
23 16280 974.0000 significant
24 15943 940.0000 year
25 16059 916.0000 group
26 16507 914.0000 effect
27 16537 900.0000 3
28 16043 891.0000 age
29 16326 881.0000 male
30 16247 868.0000 elite
31 16252 867.0000 level
32 16157 848.0000 compare
33 16251 824.0000 physical
34 15993 817.0000 measure
35 16463 806.0000 time
36 16169 805.0000 perform
37 16122 797.0000 different
38 16221 782.0000 increase
39 16500 772.0000 <
40 16275 750.0000 soccer
41 16213 747.0000 high
42 16529 722.0000 risk
43 16332 713.0000 5
44 16186 699.0000 lower
45 16156 697.0000 control
46 16293 689.0000 4
47 16037 680.0000 purpose
48 16488 673.0000 strength
49 16458 666.0000 6
50 16531 663.0000 datum
Main Path
- Ker nimamo krepkih komponent, nam CiteR omrežja ni treba pretvarjati z uporabo transformacije preprint
- V naslednjem koraku an omrežju CiteR izračunamo SPC uteži (https://github.com/bavla/biblio/wiki/mark#izra%C4%8Dun-spc-ute%C5%BEi)
SPC
CPM

Program za ustvarjanje cvja s net filom
Otoki
- na CiteR izračunam SPC
- Network/create partition/islands/generate network with islands[ON]
Izdaje po letih (hits + citations)

Izdaje po letih (hits)
