2016年6月9日 星期四

06/08 Knowledge organization, from Wikipedia


資訊組織


  • 資訊組織 (organization of information) 一詞的意義,便是
        組織任何資訊記錄(recorded information) 或資訊物件(information objects),為其建立替代性的紀錄,如文字或符號,以幫助使用者能夠查詢、檢索、辨識、取得資料。


泰勒(Taylor,1999) 認為「資訊組織」是指人類所有資訊紀錄的組織。
各種的資訊紀錄有的是屬於文字,也有的並非文字,如:各種的書籍、影像資料、聲音資料、圖像資料或是各樣的網路資源及不同的資訊物件。

好的資訊組織能夠提供使用者及時、精確並且具相關性的書目資訊。而處裡資訊組織的機構除了圖書館之外,還包括博物館美術館檔案館網際網路社群...。


  • 傳統上,在課堂名稱中,資訊組織被稱為圖書分類編目
但是圖書分類編目較偏向的是圖書館館藏目錄的編製,而沒有資訊組織的範圍大,
資訊組織所含括的部份,包括種種的資訊檢索工具的製作與研發,也就是說,除了傳統的圖書館目錄之外,還包含了索引、書目、電子化的書目資料庫及檔案查詢輔助(finding aids) ...。

  • 而近年來,在美國圖書館的系所中,開始開設了名為「 知識組織」的課程。這項課程著重在學科的內容,也就是對分類、索引典及標題表等主題分析的相關研究,也有系所準備將課程內容擴及敘述編目,特別是詮釋資料(metadata)的方面




考題!!!

  • FRAD 把權威資料的使用者分為哪 2種
6. User Tasks 用戶任務

For the purposes of this analysis, the users of authority data are broadly defined to include:
基於以上分析,規範數據用戶涵蓋廣泛,包括:
  1. authority data creators who create and maintain authority data;
規範數據的創建者和維護者。
  1. users who use authority information either through direct access to authority data orindirectly through the controlled access points (authorized forms of name, variant formsof name/references, etc.) in catalogues, national bibliographies, other similar databases, etc. 
直接檢索規範數據者或在目錄、國家書目以及類似數據庫中通過受控檢索點(名稱的規範形式、名稱的變異形式/參照等)間接使用規範信息的用戶。

  • FRAD 權威資料的使用者,執行哪 4項工作(其任務為何)?
6. User Tasks 用戶任務

Four tasks representing all users are defined as follows:
包括所有用戶在內的四個用戶任務定義如下:
  • Find          Find an entity or set of entities corresponding to stated criteria (i.e., to find either a single entity or a set of entities using an attribute or combination of attributes or a relationship of the entity as the search criteria); or to explore the universe of bibliographic entities using those attributes and relationships.
查找(Find):查找一個符合標準的實體或一組實體(即:使用單一屬性、屬性的組合或實體間關係作為檢索條件查找單一實體或一組實體);或使用屬性及其關係在整個書目實體的世界中查找。
  • Identify          Identify an entity (i.e., to confirm that the entity represented corresponds to the entity sought, to distinguish between two or more entities with similar characteristics) or to validate the form of name to be used for a controlled access point.
識別(Identify):識別一個實體(即:確認描述的實體是否符合目標實體,以區分具有相似特徵的兩個或更多實體),或確定受控檢索點的名稱形式。
  • Contextualize          Place a person, corporate body, work, etc., in context; clarify the relationship between two or more persons, corporate bodies, works, etc.; or clarify the relationship between a person, corporate body, etc., and a name by which that person, corporate body, etc., is known (e.g., name used in religion versus secular name).
放入上下文(Contextualize):將一個人、一個團體或一部作品置於環境中;闡明兩個或多個個人、團體、作品等之間的關係;或闡明一個人、一個團體以及這個人、這個團體的眾所周知的名稱之間的關係(如宗教教名與俗名之間的關係)。
  • Justify          Document the authority data creator’s reason for choosing the name or form of name on which a controlled access point is based. 
調整 (Justify):提供規範記錄創建者選擇這個名稱或名稱形式作為受控檢索點基礎的依據 。

  • FRAD 的實體(Entity)屬性(Attributes) 共16個
Person
Family
Corporate Body
Work
Expression
Manifestation
Item
Concept
Object
Event
Place
Name
Identifier
Controlled Access Point
Rules
Agency

  • FRAD 實體間的關係為何?



  • 傳統"資訊組織"根據哪 4個原則(並解釋內容)?
Among the other principles, which may be attributed to the traditional approach to KO are:
以傳統的角度切入,資訊組織有下列4個屬性:
  • Principle of controlled vocabulary 控制語彙     (用語經過管控)
例如:採用全稱檢索,而非簡稱 (O 輔仁大學學校財團法人輔仁大學;X 輔大)
                  「臺」灣的臺一定要用繁體
  • Cutter’s rule about specificity 克特訂定的字典、目錄規則中的精準     (資訊組織必須精準)
Cutter Expansive Classification克特展開式分類法
  • Hulme’s principle of literary warrant (1911)     (資訊必須存在,才能進行組織及處理)
blind entry內容未加說明的分錄、失實的記錄
  • Principle of organizing from the general to the specific 組織資訊的原則由一般特別,使類目明確、層次分明
例如:020→020.6→020.64

  • 試述 FRBR 的第一組實體彼此的關係,並以圖說明之

  • 圖中描述的關係說明,
一部作品可以通過一個或多個內容表達來實現
(因而用作品到內容表達連線的雙箭頭表示)。
另一方面,一個內容表達是一部且只是一部作品的實現
(因而用內容表達到作品連線的反向單箭頭表示)。

一個內容表達可以體現於一個或多個載體表現
同樣,一個載體表現可以體現一個或多個內容表達
一個載體表現又可以以一個或多個單件為代表
一個單件可以代表一個且只可代表一個載體表現

[一個作品,有多個內容表達;一個內容表達,不可有多個作品。]
[一個內容表達,有多個載體表現;一個載體表現,有多個內容表達。]
[一個載體表現,有多個單件;一個單件,不可有多個載體表現。]

  • FRBR有三組實體(Entity) 共10種
3. ENTITIES 
3.1.1 Group 1 Entities: Work, Expression, Manifestation, Item
3.1.2 Group 2 Entities: Person, Corporate Body
3.1.3 Group 3 Entities: Concept, Object, Event, Place 






2016年6月4日 星期六

06/01 Knowledge organization, from Wikipedia


Knowledge organization, from Wikipedia


  • Knowledge organization (KO) (or "organization of knowledge", "organization of information", "information organization") designates a field of study related to Library and Information Science (LIS).
知識組織(KO) (或“知識組織”,“信息組織”,“信息組織”) 指定相關研究領域圖書館和信息科學(LIS)。
  • In this meaning, KO is about activities such as document description, indexing and classification performed in libraries, databases, archives etc. These activities are done by librarians, archivists, subject specialists as well as by computer algorithms. 

在這個意義上,KO大約是在圖書館進行的活動,如:文件的描述,索引和分類,數據庫,檔案等。這些活動是由圖書管理員,檔案,學科專家以及由計算機算法完成的。

  • The leading journal in this field is Knowledge Organization published by the International Society for Knowledge Organization (ISKO).

在這一領域的領先期刊是知識型組織在公佈的國際社會對知識組織 (ISKO)。


1 理論方法   Theoretical approaches

1.1 傳統的方法   Traditional approaches
Among the major figures in the history of KO (其中在 KO 的歷史) , which can be classified as “traditional” (它可以被歸類為“傳統”的主要人物) , are Melvil Dewey 梅爾維爾杜威(1851-1931) and Henry Bliss 亨利·布利斯(1870-1955)。

杜威的經營方針 (Dewey’s business approach),是很難在這對KO理解為一個學科領域可以找到理論基礎智力的方法。他的興趣是不是找到一個最佳的系統 (optimal system) 支持庫的用戶,而是找到管理圖書館館藏 (manage library collections) 的有效方式。他感興趣的是發展中國家可能在許多圖書館使用的系統,來管理圖書館館藏的標準方法 (a standardized way to manage library collections)。

An important characteristic一個重要特點 in Henry Bliss’ (and many contemporary thinkers of KO) was是 that the sciences tend to reflect the order of Nature and that library classification should reflect the order of knowledge as uncovered by science 科學往往反映自然和圖書分類的順序應該反映知識的順序以科學為揭露
自然秩序
Natural order - >
科學分類
Scientific Classification - >
圖書館分類法  
Library classification (KO)

The implication is that librarians, in order to classify books, should know about scientific developments. 言下之意是,圖書館員為了分類的書籍,應該知道如何科學發展。

Among the other principles, which may be attributed to the traditional approach to KO are:
在其他的原則,這可能歸因於傳統方法 KO是:
原理控制詞彙
Principle of controlled vocabulary
刀具的統治有關的特異性
Cutters rule about specificity
赫爾姆的原則文學權證(1911)
Hulmes principle of literary warrant (1911)
從一般組織到特定的原則  
Principle of organizing from the general to the specific

如今,經過 LIS 超過100多年的研究和發展,“傳統”的做法仍然在KO,在許多方面它的原則仍佔據強勢地位。

1.2 刻面的分析方法   Facet analytic approaches
這種方法的基礎上的日期 (The date of the foundation of this approach) 可能被選為出版 S. R. Ranganathan 的冒號分類法 (Colon Classification)於1933年。辦法已得到了進一步的發展,尤其是英國的分類研究小組 (the British Classification Research Group)。在許多方面,這種方式佔據了主導地位可能被稱之為“現代分類理論”。

說明這方法的最好的方法可能是「解釋其分析合成方法 (analytico-synthetic methodology)」。
術語“分析 analysis”的含義是:打破各科到它的基本概念 (Breaking down each subject into its basic concepts.)
術語“合成 synthesis”的含義是:結合有關單位和概念來描述在手包信息的主題 (Combining the relevant units and concepts to describe the subject matter of the information package in hand.)

給予受試者(如,書名 book titles)首先分析成幾個共同的類別,這被稱為" facets"

Ranganathan  提出了他  PMEST 公式:
(Ranganathan   proposed his  PMEST formula)
Personality個性、Matter物質、
Energy能量、Space空間、Time時間

1.3 信息檢索傳統 (IR)   The information retrieval tradition (IR)
在IR-重要的傳統一直,除其他外 (Important in the IR-tradition have been, among others),
克蘭菲爾德的實驗 (the Cranfield experiments),它成立於1950年代,
TREC實驗 (the TREC experiments) (文本檢索會議 Text Retrieval Conferences)於1992年開始。
它是克蘭菲爾德實驗中,介紹了著名的措施“召回 recall”和“精確 precision”作為系統的效率評價標準。克蘭菲爾德實驗發現,分類系統 (classification systems) 如 :UDC 和刻面分析系統 (facet-analytic systems) 相比,自由文本搜索 (free-text searches)或低水平的索引系統 (low level indexing systems) (“單元項 UNITERM”)是低效率的。

#註:按字母順序排列的主題詞 Alphabetical subject headings


1.4 面向用戶和認知的觀點   User-oriented and cognitive views
specify how the design of a system is made on the basis of .
定義此方法的最好辦法是通過可能的方法:必須規定基於以用戶為導向的方法 (user-oriented approaches)的系統,如何用戶的經驗研究 (empirical studies of users) 之基礎上作出設計

用戶研究表明很早就知道用戶喜歡口頭搜索系統 (verbal search systems),而不是基於分類的符號 (classification notations) 系統。這是從用戶的實證研究得出的原理的一個例子。
大眾分類 (Folksonomies) 是最近的一種KO它是基於用戶,而不是基於圖書館員或學科專家的索引。

1.5 書目計量學的方法   Bibliometric approaches
這些方法主要是基於使用參考書目組織論文網,主要由書目耦合共引分析。近年來它已成為一個流行的活動來解釋文獻計量圖作為研究領域的結構。

兩方面的考慮是重要的在考慮 KO文獻計量學的方法 (bibliometric approaches to KO)

  1. 索引的深度的程度是部分地由分配給每個文件的項數來確定。在引用的索引,這對應於在給定的紙張的引用的數目。平均而言,科學論文含有10-15引用,提供深度的一個相當高的水平。
  2. 引用,它作為接入點,由最高的學科專業知識提供:專家們在頂級期刊寫作。這些專業知識比其圖書館目錄或書目數據庫通常都能夠利用高得多。


1.6 域分析法   The domain analytic approach
域分析 (Domain analysis) 是一個社會學認識論立場 (a sociological-epistemological standpoint)。一個給定的文件的索引應該反映一個給定組的用戶或給定的理想目的的需要。換句話說,給定文檔的任何描述或表示是或多或少適合的某些任務的完成。描述是客觀從未或中性,目標不規範描述或做一個說明一勞永逸針對不同目標人群。

丹麥圖書館“發展的 KVINFO”可以用作解釋視域解析點的例子。

KVINFO是由圖書館和作家Nynee科赫成立和它的歷史可以追溯到1965年。
對於特定用戶組(女權主義學者),組織目錄卡的另一種方式是很重要的。換句話說,不同的觀點需要組織的不同系統。