字節跳動搭建了一個知識庫,與一部史詩有關

2024年2月6日 20点热度 0人点赞

告訴大傢一個好消息:

最近,東巴文漢文合璧《創世紀》知識庫在“識典古籍”平臺上線,並免費對公眾開放。(
https://www.shidianguji.com/chuangshiji)

東巴文化,源自生活在中國西南滇、川、藏交界地區的納西族。東巴文字是一種兼備表意和表音成分的圖畫象形文字,被稱為文字的活化石,已有1000多年的歷史。為了更好推動東巴文的保護傳承、研究發展,中國國傢圖書館、麗江市東巴文化研究院、字節跳動開展了三方合作。

打開知識庫專題網頁,在用木樁搭起的桌子上,擺放著一本《創世紀》,桌子上還有一杯散著熱氣的茶。桌旁篝火架上煮著的水壺時不時升騰著熱氣,一幅納西族人平日裡的生活圖景躍然於眼前。

在知識庫建設過程中,字節跳動項目團隊實地調研東巴文化、學習東巴文字,與專傢學者反復溝通,既保證了知識庫的準確性、專業性和權威性,也兼顧了使用上的趣味性、實用性和交互性,讓東巴文真正“活”起來。

使用者在知識庫裡點擊“故事”,結合插圖和音頻,即可了解這一史詩的內容梗概。“吟誦”的加入,讓使用者可以一邊看原文,一邊聆聽東巴的全文吟誦。“字符”部分則通過音、形、意的結合,還原了納西族古老文字的風貌及獨特魅力。

古籍保護,字節跳動在持續努力。

2022年3月,字節跳動向北京大學教育基金會捐贈,支持“北京大學-字節跳動數字人文開放實驗室”的工作。字節跳動依托在OCR(光學字符識別)、自然語言處理、知識圖譜等技術領域的積累,以及互聯網產品設計與研發優勢,研發古籍數字化平臺,利用智能技術加速中華古籍資源的數字化建設,同時向全社會提供公益化服務。2022年10月,“識典古籍”數字化平臺上線,目前,該平臺免費開放古籍超過2200部。

未來,字節跳動希望攜手更多夥伴,共同參與到古籍保護與傳承事業中,共同守護寶貴的歷史文化資源。