31 |
我國大學圖書館網站網頁連結引用之研究 / The study on the sitatoin analysis of university library websites in Taiwan方靜如 Unknown Date (has links)
本研究旨在應用網路計量法,尤其是網頁連引分析法,對我國大學圖書館網站網頁進行測量和分析。一方面、以EXtract URL蒐集大學圖書館網站網路資源之相關數據,並從國家/地區(top-level domain)、單位屬性(Second-level domain)、網域名稱(Domain Name)、一致性資源位址(URL)等四個網域層級,剖析我國大學圖書館網站所蒐錄之「網路資源」的數量、網站類型、網頁內容屬性等,從而比較各大學圖書館網站所連引網路資源的共通性與特殊性;另一方面,採用搜尋引擎A1taiSta檢索並分析這些大學圖書館網站綱頁在網網相連的虛擬世界中,為其他綱頁所連結引用的程度與情形,包括連引次數與網路影響係數的計算,以及連引網頁之語文,並透過跨時研究比較其在前後七個月的兩個時點上被連引情形的消長。
本研究所規範的「網路資源」範疇,乃依圖書館網站組織與呈現網路資源的方式與取向區別為三類,其中以「一般性網路資源」和「參性網路資源」居多,「專題性網路資源」則相對較少。研究結果發現39個大學圖書館網站中提供「網路資源」服務的佔有34個,共收錄了10,144筆網路資源,平均每個圖書館收錄298.35筆,其中靜宜大學圖書館以1,429筆奪得第一。實際上,這些網路資源來自於54個國家/地區網域;4,606個不同的綱域名稱;6,818個不同的網址。若將其網址依國家/地區網域做分析,我國(.tw)網域佔五成以上,而其中又有半數為學術網域所含括;居次者為美國,所佔將近四成,而商業網域又佔有其申四成;若依單位屬性網域做分析,以屬於學術網域的網路資源所佔達四成為最多,其中以我國與美國網域貢獻最多;屬於公司網域緊隨於後,佔有將近三成.,其申以美國與我國綱域貢獻最多。在被連引次數上,國內網站以被連引網頁次數累積達150次的中央研究院為最高,其次為教育部、行政院主計處、國家圖書館等網站;國外網站則以美國國家醫學圖書館與柏克萊數位圖書館SunSITE並列第一。大致上,可將我國大學圖書館網站所連引網路資源歸納為八類,被連引最多的類型是圖書資訊服務,其餘依次為政府機關、學術單位、研究機構、博物館/數位博物館、書店/網路書店、國際組織、其他等。"
外部連引可作為評估圖書館網站對外部網站的影響力之依據;而內部連引則反映了圖書館網站與校園網域內的其他網站的互動。本研究結果顯示,外部連引次數以成大、台大、央大等圖書館次數為領先;內部連引次數則以台大、交大、政大等圖書館居前。以連引數為分子,網頁數為分母所計算出的網路影響係數方面,所有大學圖書館網站的影響係數為0,33,亦即表示我國大學圖書館網站,平均每一個網頁被連引0.33次;外部連引的網路影響係數以逢甲、東華、中正等大學圖書館領先;內部連引的網路影響係數則以東華、南華、世新等大學圖書館居前。另外,在連引網頁的語文方面,我國大學圖書館網站被中文綱頁所連引的數量佔 93.57%;被英文綱頁所連引的數量佔9.46%,其餘語言則佔0、73%。
本研究建議圖書館應透過電腦軟體與人工定期檢閱連引節 點之有效性;並拓展專題性與特藏性網路資源的建置,以期建立各館之不可替代性的網路資源;同時深入連引網站內層之綱頁內容,以一個網頁或一個網頁片段作為一個連引單元,俾能強化其對使用者的實質效益。圖書館也能善用搜尋引擎以調查圖書館網站被內部和外部連引的情形,以自我評估圖書館網站與內、外部網域社群之間的互動和影響。另外,本土性的幾家中文搜尋引擎,加Openfind、Gais等,除應致力於擴展索引涵蓋的版圖興提升穩定性高的檢索結果外,還能豐富其相關檢索功能。 / The purpose of this study is to apply webometrics, especially sitation analysis, to examine and analyze thirty-nine university library websites in Taiwan. On one hand, the study utilized Extract URL to collect data aboutInternet resources of university library websites, and analyzed top-level DNS,second-level DNS, Domain Name, URL, respectively. The similarities and differences of the university library websites among each other were compared based on the analyses of number, types of websites and attributes of web pages of the "Internet resources". On the other hand, the study used AltaVista to retrieve and analyze the web pages of university library websites which interlinked by other web pages in the labyrinthine cyberspace. The Items measured included the numbers of total sitation, external sitation, internal sitation, and self-sitation, as well as languages of linking web pages.Furthermore, the investigation ran through two time spots across seven months to observe the changes of the sitations.
The "Internet resources" appeared on the library website were organized into three categories: "general resources" and "reference resources", came out to be the majority, whereas the "specific resources" was the minority. The study found that thirty-four out of thirty-nine university library websites had provided service of Internet resources, and the items of Internet resources were 10,144 in total, from 54 different top-level DNS, 4,606 different Domain Name, and 6,818 different URLs. The average number of Internet resources per library website was 298.35. The Providence University Library earned the first. The analysis of top-level domain showed that the Taiwan was in the majority, and USA got the second. The analysis of second-level domain also found that academic domain earned the first, and business domain was the second. TheInternet resources can be grouped into eight types: library and information services was the first, and the other included government institutions, academic organizations,reseah institutes, museum/digital museum, bookstores/Internet bookstores, international organizations and others.
External sitation is seen as an indicator of significance and influence of a site for external websites, and internal sitation may respond interaction and effect between a university library website and other websites in web domain of campus. The findings of study revealed that the external sitations ofNational Cheng Kung Universe Library, National Taiwan University Library and National Central University Library were the first group; and the internal sitations of National Taiwan University Library, National Chengchi University Library and National Chiao Tung University Library were the top group.Besides, the Web Impact Factor of university libraries in Taiwan was 0.33. The number of Chinese web pages that linked to university library websites turned out to be 93.57% whereas the number of English web pages was only 9.46%.The number of web pages linked in other language was only 0.73%.
Finally, the study suggested that libraries should better use computer software and human aids to check the validity of hyperlinks; and devote library staff's energies into the development of specific Internet resources; further,libraries should link the content of web pages of websites in depth. Libraries should also examine various sitations of self library website to evaluate the interaction and influence of the library website with inside and outside web domain. Local search engines, for instance, Openfind and Gais, should strengthen the scope of index, enhance the stability of searching, and improve the retrieval functions in the filture.
|
32 |
Digital Intelligence – Möglichkeiten und Umsetzung einer informatikgestützten Frühaufklärung / Digital Intelligence – opportunities and implementation of a data-driven foresightWalde, Peter 18 January 2011 (has links) (PDF)
Das Ziel der Digital Intelligence bzw. datengetriebenen Strategischen Frühaufklärung ist, die Zukunftsgestaltung auf Basis valider und fundierter digitaler Information mit vergleichsweise geringem Aufwand und enormer Zeit- und Kostenersparnis zu unterstützen. Hilfe bieten innovative Technologien der (halb)automatischen Sprach- und Datenverarbeitung wie z. B. das Information Retrieval, das (Temporal) Data, Text und Web Mining, die Informationsvisualisierung, konzeptuelle Strukturen sowie die Informetrie. Sie ermöglichen, Schlüsselthemen und latente Zusammenhänge aus einer nicht überschaubaren, verteilten und inhomogenen Datenmenge wie z. B. Patenten, wissenschaftlichen Publikationen, Pressedokumenten oder Webinhalten rechzeitig zu erkennen und schnell und zielgerichtet bereitzustellen. Die Digital Intelligence macht somit intuitiv erahnte Muster und Entwicklungen explizit und messbar.
Die vorliegende Forschungsarbeit soll zum einen die Möglichkeiten der Informatik zur datengetriebenen Frühaufklärung aufzeigen und zum zweiten diese im pragmatischen Kontext umsetzen.
Ihren Ausgangspunkt findet sie in der Einführung in die Disziplin der Strategischen Frühaufklärung und ihren datengetriebenen Zweig – die Digital Intelligence.
Diskutiert und klassifiziert werden die theoretischen und insbesondere informatikbezogenen Grundlagen der Frühaufklärung – vor allem die Möglichkeiten der zeitorientierten Datenexploration.
Konzipiert und entwickelt werden verschiedene Methoden und Software-Werkzeuge, die die zeitorientierte Exploration insbesondere unstrukturierter Textdaten (Temporal Text Mining) unterstützen. Dabei werden nur Verfahren in Betracht gezogen, die sich im Kontext einer großen Institution und den spezifischen Anforderungen der Strategischen Frühaufklärung pragmatisch nutzen lassen. Hervorzuheben sind eine Plattform zur kollektiven Suche sowie ein innovatives Verfahren zur Identifikation schwacher Signale.
Vorgestellt und diskutiert wird eine Dienstleistung der Digital Intelligence, die auf dieser Basis in einem globalen technologieorientierten Konzern erfolgreich umgesetzt wurde und eine systematische Wettbewerbs-, Markt- und Technologie-Analyse auf Basis digitaler Spuren des Menschen ermöglicht.
|
33 |
Digital Intelligence – Möglichkeiten und Umsetzung einer informatikgestützten Frühaufklärung: Digital Intelligence – opportunities and implementation of a data-driven foresightWalde, Peter 15 December 2010 (has links)
Das Ziel der Digital Intelligence bzw. datengetriebenen Strategischen Frühaufklärung ist, die Zukunftsgestaltung auf Basis valider und fundierter digitaler Information mit vergleichsweise geringem Aufwand und enormer Zeit- und Kostenersparnis zu unterstützen. Hilfe bieten innovative Technologien der (halb)automatischen Sprach- und Datenverarbeitung wie z. B. das Information Retrieval, das (Temporal) Data, Text und Web Mining, die Informationsvisualisierung, konzeptuelle Strukturen sowie die Informetrie. Sie ermöglichen, Schlüsselthemen und latente Zusammenhänge aus einer nicht überschaubaren, verteilten und inhomogenen Datenmenge wie z. B. Patenten, wissenschaftlichen Publikationen, Pressedokumenten oder Webinhalten rechzeitig zu erkennen und schnell und zielgerichtet bereitzustellen. Die Digital Intelligence macht somit intuitiv erahnte Muster und Entwicklungen explizit und messbar.
Die vorliegende Forschungsarbeit soll zum einen die Möglichkeiten der Informatik zur datengetriebenen Frühaufklärung aufzeigen und zum zweiten diese im pragmatischen Kontext umsetzen.
Ihren Ausgangspunkt findet sie in der Einführung in die Disziplin der Strategischen Frühaufklärung und ihren datengetriebenen Zweig – die Digital Intelligence.
Diskutiert und klassifiziert werden die theoretischen und insbesondere informatikbezogenen Grundlagen der Frühaufklärung – vor allem die Möglichkeiten der zeitorientierten Datenexploration.
Konzipiert und entwickelt werden verschiedene Methoden und Software-Werkzeuge, die die zeitorientierte Exploration insbesondere unstrukturierter Textdaten (Temporal Text Mining) unterstützen. Dabei werden nur Verfahren in Betracht gezogen, die sich im Kontext einer großen Institution und den spezifischen Anforderungen der Strategischen Frühaufklärung pragmatisch nutzen lassen. Hervorzuheben sind eine Plattform zur kollektiven Suche sowie ein innovatives Verfahren zur Identifikation schwacher Signale.
Vorgestellt und diskutiert wird eine Dienstleistung der Digital Intelligence, die auf dieser Basis in einem globalen technologieorientierten Konzern erfolgreich umgesetzt wurde und eine systematische Wettbewerbs-, Markt- und Technologie-Analyse auf Basis digitaler Spuren des Menschen ermöglicht.:Kurzzusammenfassung 2
Danksagung 3
Inhaltsverzeichnis 5
Tabellenverzeichnis 9
Abbildungsverzeichnis 10
A – EINLEITUNG 13
1 Hintergrund und Motivation 13
2 Beitrag und Aufbau der Arbeit 16
B – THEORIE 20
B0 – Digital Intelligence 20
3 Herleitung und Definition der Digital Intelligence 21
4 Abgrenzung zur Business Intelligence 23
5 Übersicht über unterschiedliche Textsorten 24
6 Informetrie: Bibliometrie, Szientometrie, Webometrie 29
7 Informationssysteme im Kontext der Digital Intelligence 31
B1 – Betriebswirtschaftliche Grundlagen der Digital Intelligence 36
8 Strategische Frühaufklärung 37
8.1 Facetten und historische Entwicklung 37
8.2 Methoden 41
8.3 Prozess 42
8.4 Bestimmung wiederkehrender Termini 44
8.5 Grundlagen der Innovations- und Diffusionsforschung 49
B2 – Informatik-Grundlagen der Digital Intelligence 57
9 Von Zeit, Daten, Text, Metadaten zu multidimensionalen zeitorientierten (Text)Daten 59
9.1 Zeit – eine Begriffsbestimmung 59
9.1.1 Zeitliche Grundelemente und Operatoren 59
9.1.2 Lineare, zyklische und verzweigte Entwicklungen 62
9.1.3 Zeitliche (Un)Bestimmtheit 62
9.1.4 Zeitliche Granularität 63
9.2 Text 63
9.2.1 Der Text und seine sprachlich-textuellen Ebenen 63
9.2.2 Von Signalen und Daten zu Information und Wissen 65
9.3 Daten 65
9.3.1 Herkunft 65
9.3.2 Datengröße 66
9.3.3 Datentyp und Wertebereich 66
9.3.4 Datenstruktur 67
9.3.5 Dimensionalität 68
9.4 Metadaten 69
9.5 Zusammenfassung und multidimensionale zeitorientierte Daten 70
10 Zeitorientierte Datenexplorationsmethoden 73
10.1 Zeitorientierte Datenbankabfragen und OLAP 76
10.2 Zeitorientiertes Information Retrieval 78
10.3 Data Mining und Temporal Data Mining 79
10.3.1 Repräsentationen zeitorientierter Daten 81
10.3.2 Aufgaben des Temporal Data Mining 86
10.4 Text Mining und Temporal Text Mining 91
10.4.1 Grundlagen des Text Mining 98
10.4.2 Entwickelte, genutzte und lizensierte Anwendungen des Text Mining 107
10.4.3 Formen des Temporal Text Mining 110
10.4.3.1 Entdeckung kausaler und zeitorientierter Regeln 110
10.4.3.2 Identifikation von Abweichungen und Volatilität 111
10.4.3.3 Identifikation und zeitorientierte Organisation von Themen 112
10.4.3.4 Zeitorientierte Analyse auf Basis konzeptueller Strukturen 116
10.4.3.5 Zeitorientierte Analyse von Frequenz, Vernetzung und Hierarchien 117
10.4.3.6 Halbautomatische Identifikation von Trends 121
10.4.3.7 Umgang mit dynamisch aktualisierten Daten 123
10.5 Web Mining und Temporal Web Mining 124
10.5.1 Web Content Mining 125
10.5.2 Web Structure Mining 126
10.5.3 Web Usage Mining 127
10.5.4 Temporal Web Mining 127
10.6 Informationsvisualisierung 128
10.6.1 Visualisierungstechniken 130
10.6.1.1 Visualisierungstechniken nach Datentypen 130
10.6.1.2 Visualisierungstechniken nach Darstellungsart 132
10.6.1.3 Visualisierungstechniken nach Art der Interaktion 137
10.6.1.4 Visualisierungstechniken nach Art der visuellen Aufgabe 139
10.6.1.5 Visualisierungstechniken nach Visualisierungsprozess 139
10.6.2 Zeitorientierte Visualisierungstechniken 140
10.6.2.1 Statische Repräsentationen 141
10.6.2.2 Dynamische Repräsentationen 145
10.6.2.3 Ereignisbasierte Repräsentationen 147
10.7 Zusammenfassung 152
11 Konzeptuelle Strukturen 154
12 Synopsis für die zeitorientierte Datenexploration 163
C – UMSETZUNG EINES DIGITAL-INTELLIGENCESYSTEMS 166
13 Bestimmung textbasierter Indikatoren 167
14 Anforderungen an ein Digital-Intelligence-System 171
15 Beschreibung der Umsetzung eines Digital-Intelligence-Systems 174
15.1 Konzept einer Dienstleistung der Digital Intelligence 175
15.1.1 Portalnutzung 177
15.1.2 Steckbriefe 178
15.1.3 Tiefenanalysen 180
15.1.4 Technologiescanning 185
15.2 Relevante Daten für die Digital Intelligence (Beispiel) 187
15.3 Frühaufklärungs-Plattform 188
15.4 WCTAnalyze und automatische Extraktion themenspezifischer Ereignisse 197
15.5 SemanticTalk 200
15.6 Halbautomatische Identifikation von Trends 204
15.6.1 Zeitreihenkorrelation 205
15.6.2 HD-SOM-Scanning 207
D – ZUSAMMENFASSUNG 217
Anhang A: Prozessbilder entwickelter Anwendungen des (Temporal) Text Mining 223
Anhang B: Synopsis der zeitorientierten Datenexploration 230
Literaturverzeichnis 231
Selbstständigkeitserklärung 285
Wissenschaftlicher Werdegang des Autors 286
Veröffentlichungen 287
|
Page generated in 0.074 seconds