<u id="csuau"><bdo id="csuau"><pre id="csuau"></pre></bdo></u><acronym id="csuau"><bdo id="csuau"></bdo></acronym>
  • <wbr id="csuau"><ins id="csuau"><table id="csuau"></table></ins></wbr>
    <wbr id="csuau"><table id="csuau"><button id="csuau"></button></table></wbr>
    1. <video id="csuau"><table id="csuau"></table></video>

    <i id="csuau"><bdo id="csuau"></bdo></i>
    <track id="csuau"><table id="csuau"></table></track><i id="csuau"><bdo id="csuau"></bdo></i>
  • <i id="csuau"><bdo id="csuau"><samp id="csuau"></samp></bdo></i>
      <wbr id="csuau"><ins id="csuau"><progress id="csuau"></progress></ins></wbr><b id="csuau"></b>
    1. 龐大的外文數(shù)據(jù)庫如何運用于我國世界史研究?

      2020年07月20日 09:29    來源:光明日報    姚百慧

        原標題:我國世界史研究中外文數(shù)據(jù)庫的利用

        據(jù)筆者調(diào)查,國內(nèi)主要圖書館購買的以及可免費利用的外文專業(yè)數(shù)據(jù)庫資源,已超過千種。這些數(shù)據(jù)庫就文獻類型而言,可分為圖書、期刊、學位論文與會議論文、報紙、檔案、統(tǒng)計資料、報告、書目與文摘、圖片、音視頻等。就收入內(nèi)容而言,歷史學涉及史學理論、世界通史與斷代史、地區(qū)國別史(涉及70個左右的國家)、傳記、文物考古,其他學科如地理、哲學與宗教、政治與法律、軍事、經(jīng)濟、文化、科學、教育、體育、語言與文字、文學、藝術(shù)、醫(yī)藥衛(wèi)生等,也有很多資源可以參考。世界史研究需要利用數(shù)據(jù)庫尤其是外文數(shù)據(jù)庫,這是無須爭辯的問題。需要討論的是,如何對這些數(shù)量龐大的數(shù)據(jù)庫進行利用。本文從定名與定性、專題數(shù)據(jù)庫的建立、數(shù)據(jù)庫內(nèi)容考辨三個角度,談一些粗淺的看法。

        一 

        所謂定名與定性,是指對數(shù)據(jù)庫的名稱、性質(zhì)和收錄范圍有清晰的認識。

        一般而言,因數(shù)據(jù)庫開發(fā)者都會提供數(shù)據(jù)庫名稱,定名問題不會有太大的困難,但也有一些特殊情況。其一,數(shù)據(jù)庫開發(fā)者有時會改變數(shù)據(jù)庫的名稱,從而導致在不同的館藏地或不同的學者引用中對同一數(shù)據(jù)庫標引不同。如美國檔案類數(shù)據(jù)庫“美國解密檔案在線”(U.S. Declassified Documents Online),原名為“解密檔案參考系統(tǒng)”(Declassified Documents Reference System);期刊類全文數(shù)據(jù)庫“綜合學科學術(shù)文獻大全”(Academic Search Complete),原來的英文名為“Academic Search Premier”。在這種情況下,建議標引以最新名稱為準,同時了解其歷史名稱。其二,存在總庫、子庫的情況。如HeinOnline法律數(shù)據(jù)庫有60余個子庫,美國國會圖書館的“數(shù)字化收藏”(Digital Collections)有300多個子庫。一些開發(fā)商或代理商,還會重組其數(shù)據(jù)資源,形成新的總庫。如Gale公司,它把旗下部分報紙期刊類的庫組成Gale NewsVault,又把以檔案為主的300余個子庫組成“珍稀原始典藏檔案”(Archives Unbound,簡稱AU),還把這兩個庫和它的其他偏重原始檔案文獻的子庫組合起來,形成了Gale Scholar超大型數(shù)據(jù)庫。就個人利用而言,清晰的子庫名稱更重要;但由于一些館藏只標引了總庫,所以也需要了解總庫名稱。其三,館藏機構(gòu)的標引方式,也會造成名稱的混亂。比如,有的館藏只列翻譯而無原文名稱,各館藏有時翻譯名稱不同,以及有的館藏根據(jù)購買情況重新擬定數(shù)據(jù)庫名稱。如國家圖書館購買了AU中亞洲的部分專輯,命名為“珍稀原始典藏檔案合集:亞洲”(Archives Unbound Asia)。

        確定性質(zhì)指確定文獻的收錄類型。前文已提及,外文數(shù)據(jù)庫的文獻類型包括圖書、期刊、報紙、檔案等。不同類型的文獻,在史學研究中所起到的作用是不同的,或作為目錄檢索路徑,或作為前期學術(shù)史,或作為史料來源。在開發(fā)商或圖書館的數(shù)據(jù)庫介紹中,會說明文獻的類型或特征。需要強調(diào)的是,上述文獻是基于現(xiàn)代的出版類型進行分類的,它很難完全體現(xiàn)人類過去所積累的文獻的所有特征,所以只能是相對性的。比如,檔案在今天往往指代有密級的、生成之時尚不能為一般公眾查看的文獻,但對于古代史而言,甲骨、碑銘、紙草文書、木板文書等,不管其當時的利用范圍如何,都已是研究那個時代的珍貴“檔案”了。

        確定收錄范圍,指弄清數(shù)據(jù)庫收錄的內(nèi)容特征。在數(shù)據(jù)庫的介紹中,一般會對此作出說明,如“早期英文書籍在線”(Early English Books Online)的介紹,一般會說明其收錄的數(shù)量(12.5萬余種、超過2250萬頁英文著作)、時段(1473—1700年之間)、類型(名家著作、皇家條例及布告、軍事、宗教和其他公共文件、年鑒)、學科范圍(歷史、語言、音樂、美術(shù)、物理學、婦女研究)等。但確定內(nèi)容特征有時也會有一定的困難,上文提及的總庫與子庫的情況是其中之一。有的數(shù)據(jù)庫有很多子庫,但圖書館一般只會選擇部分子庫購買,而標引時卻用總庫名稱,這樣就很難知道該庫在某一具體館中的子庫收錄情況。另一種情況是,很多圖書館會選擇數(shù)據(jù)庫中與本校教學科研密切的模塊來購買,從而導致即便沒有子庫的數(shù)據(jù)庫,在各館中收錄內(nèi)容差異也較大。比如Sage期刊庫,有的館(如首都師范大學)購買了500多種現(xiàn)刊,有的館(如北京大學)則購買了800多種現(xiàn)刊。同名數(shù)據(jù)庫各館收藏不同,會讓同一檢索在不同的館藏出現(xiàn)差異甚至差別較大。此外,有的數(shù)據(jù)庫以模塊形式呈現(xiàn),模塊下內(nèi)容較多,而模塊名稱卻未必能完整展現(xiàn)其收錄內(nèi)容。如ProQuest歷史庫的一個模塊“越南戰(zhàn)爭和美國外交政策(1960—1975年)”(Vietnam War and American Foreign Policy,1960—1975)是一個單一的數(shù)據(jù)庫,從其名稱來看,只能判斷其與越戰(zhàn)有關(guān)。但這個數(shù)據(jù)庫收錄內(nèi)容廣泛,含有104個子輯,內(nèi)容極其豐富,比如有成系列的美國國家安全委員會文件、國家安全委員會會議記錄,從肯尼迪到尼克松時期的國家安全文件等,實際上是戰(zhàn)后到20世紀70年代美國外交史研究的重要資源。像這類數(shù)據(jù)庫,不了解其子輯內(nèi)容就沒法深入利用。

        二 

        定名與定性是我們利用外文數(shù)據(jù)庫的起步工作。接下來,就可以大體判斷某一數(shù)據(jù)庫與我們所從事研究的關(guān)系,從而確定是否要加以搜集和利用。類似于做專題文獻書目一樣,在從事一項專題性的學術(shù)研究時,也要圍繞該研究搜集在線資源,做一個專題數(shù)據(jù)庫的列表。需要注意的是,這些專題數(shù)據(jù)庫搜集時面不能過窄,它們不僅要包括與某一研究直接相關(guān)的數(shù)字資源,也要包括一些宏觀性質(zhì)的及可能相關(guān)的其他數(shù)據(jù)庫。如研究兩次世界大戰(zhàn)期間英國的綏靖外交,首選當然是英國的外交檔案以及重要人物的文件集,如收錄了60余冊《英國外交政策文件,1919—1939年》的“英國海外政策文件”(Documents on British Policy Overseas)數(shù)據(jù)庫、內(nèi)維爾·張伯倫和奧斯丁·張伯倫的文件集(The Papers of Neville Chamberlain; The Papers of Sir Austen Chamberlain)、“丘吉爾檔案”(Churchill Archive),次選是這一時期的內(nèi)閣文件(Cabinet Papers)和國會文件的系列數(shù)據(jù)庫(U.K.Parliamentary Papers, House of Commons Parliamentary Papers, Hansard等),最后是反映當時媒體動向的重要報刊,如“大英圖書館報紙”(British Library Newspapers)、《泰晤士報》《每日電訊報》《倫敦新聞畫報》《圖畫郵報》等。同時,通過“英國外交部機密印刷件:北美,1824—1961年”(Confidential Print: North America, 1824—1961)、“英國外交部:美國通信”(British Foreign Office: United States Correspondence)、“英國外交部檔案:日本,1919—1952年”(Foreign Office Files for Japan,1919—1952)、“英國外交部檔案:中國,1919—1980年”(Foreign Office Files for China,1919—1980)等英國檔案數(shù)據(jù)庫,以及美國、日本、德國、澳大利亞、加拿大等國家的外交檔案數(shù)字資源,可了解圍繞英國綏靖行動有關(guān)國家的互動。以上搜集偏重于兩次世界大戰(zhàn)期間與英國有關(guān)、相對原始的文獻,也不能忽略一般的通用數(shù)據(jù)庫,比如圖書資源(約50種)、期刊資源(約30種)、學位論文資源(十余種)等。

        三 

        在搜集到相當?shù)碾娮淤Y源后,還要進行內(nèi)容考辨的工作。這一考辨,可以從兩個角度入手。

        一是觀察數(shù)據(jù)庫資料來源和開發(fā)機構(gòu)。一般而言,政府機構(gòu)公布的本機構(gòu)所掌握文獻的權(quán)威性,高于其他來源;知名開發(fā)商、學術(shù)機構(gòu)開發(fā)的專業(yè)性數(shù)據(jù)庫,高于一般網(wǎng)絡(luò)資源。例如,我們要查美國人口數(shù)據(jù),最優(yōu)先利用的是美國人口普查局開發(fā)的“美國事實發(fā)現(xiàn)者”(American Fact Finder),它可以提供美國人口、住房、經(jīng)濟和地理數(shù)據(jù)的來源;關(guān)于美國農(nóng)業(yè)人口,則要參閱農(nóng)業(yè)部的“國家農(nóng)業(yè)統(tǒng)計數(shù)據(jù)”(National Agricultural Statistics Service),它提供了自1840年以來美國各州和地區(qū)的農(nóng)業(yè)人口普查數(shù)據(jù);還可以利用明尼蘇達大學的“美國國家歷史地理信息系統(tǒng)”(National Historical Geographic Information System),它提供了1790年至今的美國人口普查和其他全國性調(diào)查統(tǒng)計資料,包括帶有地理空間屬性信息的人口、農(nóng)業(yè)、經(jīng)濟等方面的數(shù)據(jù)。

        二是注重數(shù)據(jù)形式和原實體之間的關(guān)系。就人文學科的多數(shù)數(shù)據(jù)庫而言,其數(shù)據(jù)往往來自某種實物。利用這種數(shù)據(jù)庫時,除了傳統(tǒng)利用實物載體要注意的考辨等工作外,還要考察數(shù)據(jù)形式同原實體之間的關(guān)系。如紙質(zhì)文獻在電子化的過程中,是完整電子化,還是部分電子化?電子化的文獻是如何排列的,這種排列同原始文獻的排列關(guān)系何在?等等。如ProQuest公司開發(fā)的“數(shù)字化國家安全檔案”(Digital National Security Archive),其文獻選取和組合模式是圍繞某一國家安全問題,抽取來自不同機構(gòu)的檔案,并按時間先后組織在新的子輯中。雖然所抽取的檔案是完整掃描,但它并不會完整掃描原檔案所在卷宗或系列,研究人員只能通過不同檔案的時序排列建立起聯(lián)系。利用這類數(shù)據(jù)庫時,有時還需使用相關(guān)的配套指南、大事年表、人名索引等工具。

        定名與定性、建立專題數(shù)據(jù)庫、內(nèi)容考辨,是利用外文數(shù)據(jù)庫的基礎(chǔ)工作。做好這些工作,研究者可以更高效準確地找到自己所需要的電子資源。當然,它們并非利用外文數(shù)據(jù)庫注意事項的全部,如從知識考古學角度,可以討論數(shù)據(jù)庫開發(fā)的知識背景、開發(fā)動機、開發(fā)人員組成、文獻著錄方式等;從文獻挖掘角度,可以討論挖掘工具的選用、關(guān)鍵詞選取、算法等,這些都是我們在使用數(shù)據(jù)庫時需要考慮的內(nèi)容。

       。ㄗ髡撸阂Π倩,系首都師范大學歷史學院教授) 

      更多精彩內(nèi)容,請點擊進入文化產(chǎn)業(yè)頻道>>>>>

      (責任編輯: 郭博文 )

      龐大的外文數(shù)據(jù)庫如何運用于我國世界史研究?

      2020-07-20 09:29 來源:光明日報
      查看余下全文
      欧美精品高清在线观看爱美_乱人伦人妻中文字幕在线入口_亚洲精品无码高潮喷水在线播放_91日本在线精品高清观看
      <u id="csuau"><bdo id="csuau"><pre id="csuau"></pre></bdo></u><acronym id="csuau"><bdo id="csuau"></bdo></acronym>
    2. <wbr id="csuau"><ins id="csuau"><table id="csuau"></table></ins></wbr>
      <wbr id="csuau"><table id="csuau"><button id="csuau"></button></table></wbr>
      1. <video id="csuau"><table id="csuau"></table></video>

      <i id="csuau"><bdo id="csuau"></bdo></i>
      <track id="csuau"><table id="csuau"></table></track><i id="csuau"><bdo id="csuau"></bdo></i>
    3. <i id="csuau"><bdo id="csuau"><samp id="csuau"></samp></bdo></i>
        <wbr id="csuau"><ins id="csuau"><progress id="csuau"></progress></ins></wbr><b id="csuau"></b>
      1. 徐水县| 龙口市| 永新县| 霞浦县| 文成县| 淮阳县| 耿马| 康保县| 宜宾市| 连江县| 澄江县| 左贡县| 松溪县| 陆良县| 天镇县| 湖北省| 海口市| 崇州市| 安化县| 隆昌县| 利川市| 仪陇县| 垣曲县| 丹东市| 淳化县| 乐陵市| 平山县| 额尔古纳市| 曲水县| 龙山县| 陇南市| 北辰区| 周宁县| 清水河县| 汝阳县| 濉溪县| 斗六市| 新津县| 民丰县| 朔州市| 台中县| http://444 http://444 http://444