트리뱅크

Treebank
대부분의 구문 트리뱅크는 구문 구조(왼쪽) 또는 종속 구조(오른쪽)의 변형에 주석을 추가합니다.

언어학에서 트리뱅크구문적 또는 의미적 문장 구조에 주석을 다는 구문 분석된 텍스트 말뭉치입니다.1990년대 초 구문 분석된 말뭉치의 건설은 대규모 경험적 [1]데이터의 혜택을 받은 컴퓨터 언어학에 혁명을 일으켰다.

어원학

트리뱅크라는 용어는 1980년대 언어학자 Geoffrey Lich에 의해 종자은행이나 [2]혈액은행과 같은 다른 저장소와 비유하여 만들어졌다.이것은 통사적 구조와 의미적 구조 모두 나무 구조로서 구성적으로 표현되기 때문이다.구문 분석된 말뭉치라는 용어는 나무보다는 문장의 우선성에 중점을 두고 트리뱅크라는 용어와 종종 서로 바꿔서 사용된다.

건설

트리뱅크는 이미 음성 태그가 달린 말뭉치 위에 생성되는 경우가 많습니다.그 결과, 트리 뱅크는 의미론이나 다른 언어 정보로 강화되기도 합니다.트리뱅크는 완전히 수동으로 작성할 수 있습니다.여기서 언어학자는 구문구조를 사용하여 각 문장에 주석을 달거나 반자동으로 주석을 달 수 있습니다.여기서 파서는 언어학자가 확인하고 필요에 따라 수정하는 구문구조를 할당합니다.실제로 자연어 말뭉치를 완전히 체크하고 파싱을 완료하는 것은 노동 집약적인 프로젝트이며, 대학원 언어학자로 구성된 팀이 몇 년 동안 작업해야 합니다.주석 상세 수준과 언어 샘플의 폭에 따라 작업의 어려움과 트리 뱅크를 구축하는 데 필요한 시간이 결정됩니다.

John이 Mary를 사랑하는 경우의 예제 구문 구조 트리
코란 아랍어 코퍼스의 하이브리드 선거구/의존성 트리

일부 트리뱅크는 구문 주석에서 특정 언어 이론을 따르지만(예: BulTreeBank는 HPSG를 따른다) 대부분은 이론 특이성을 낮추려고 합니다.단, 두 가지 주요 그룹이 구별될 수 있다.구조에 주석을 다는 트리뱅크(예: 펜 트리뱅크 또는 ICE-GB)와 종속성 구조에 주석을 다는 트리뱅크(예: 프라하 종속성 트리뱅크 또는 코란 아랍어 종속성 트리뱅크)이다.

주석이 달린 데이터를 저장하는 데 사용되는 파일 형식과 형식 표현 간의 차이를 명확히 하는 것이 중요합니다.트리뱅크는 반드시 특정 문법에 따라 구축됩니다.동일한 문법이 다른 파일 형식으로 구현될 수 있습니다.예를 들어 오른쪽 그림에 나와 있는 John loves Mary 구문 분석은 다음과 같이 텍스트파일 내에서 다음과 같이 라벨이 붙은 간단한 괄호로 나타낼 수 있습니다( 트리뱅크 표기법에 따름).

(S(NP John)(VP(VPZ loves)(NP(NP Mary)))).

이러한 유형의 표현은 리소스가 적고 트리 구조가 소프트웨어 도구 없이도 비교적 읽기 쉽기 때문에 널리 사용됩니다.그러나 말뭉치가 점점 복잡해짐에 따라 다른 파일 형식이 선호될 수 있습니다.다른 방법으로는 트리뱅크 고유의 XML 스킴, 번호부착, 다양한 유형의 교착 표기가 있습니다.

적용들

컴퓨터 언어학[3] 관점에서 보면, 트리뱅크는 음성 태그, 파서, 의미 분석기, 기계 번역 [4]시스템 등의 최첨단 자연어 처리 시스템을 설계하기 위해 사용되어 왔습니다.대부분의 계산 시스템은 골드 스탠다드 트리뱅크 데이터를 사용합니다.그러나 인간 언어학자에 의해 수정되지 않은 자동 구문 분석 말뭉치는 여전히 유용할 수 있다.파서의 규칙 빈도에 대한 증거를 제공할 수 있습니다.파서를 대량의 텍스트에 적용하여 규칙 빈도를 수집함으로써 파서를 개선할 수 있습니다.그러나, 손으로 말뭉치를 수정하고 완료하는 과정을 통해서만 파서 지식 기반에 없는 규칙을 식별할 수 있다는 것은 분명해야 한다.또한 주파수가 더 정확할 수 있습니다.

말뭉치 언어학에서 트리뱅크는 구문 현상을 연구하기 위해 사용된다(예를 들어, 통사 변화의 시간 과정을 연구하기 위해 사용될 수 있다).일단 구문 분석되면, 말뭉치는 다양한 문법 구조가 얼마나 일반적으로 사용되는지를 보여주는 빈도 증거를 포함할 것이다.또한 트리뱅크는 커버리지의 증거를 제공하고 예상치 못한 새로운 문법 현상의 발견을 지원합니다.

이론언어학 심리언어학에서 트리뱅크의 또 다른 용도는 상호작용 증거이다.완성된 트리뱅크는 언어학자들이 하나의 문법적 구조를 사용하는 결정이 다른 구조를 형성하는 결정에 어떻게 영향을 미치는지, 그리고 화자와 작가가 문장을 형성하면서 어떻게 결정을 내리는지에 대한 실험을 수행하는 데 도움을 줄 수 있다.상호 작용 연구는 의미론, 실용론 등 주석의 추가 계층이 말뭉치에 추가됨에 따라 특히 효과적이다.그러면 문법적 선택에 대한 비통사적 현상의 영향을 평가할 수 있다.

언어학 연구에서 주석 처리된 트리뱅크 데이터는 많은 양의 자연 발생 [citation needed]예에 대한 문장 구조의 언어 이론을 테스트하기 위해 구문 연구에 사용되어 왔다.

시멘틱 트리 뱅크

시맨틱 트리뱅크는 의미 표현으로 주석을 단 자연어 문장의 집합이다.이러한 자원은 각 문장의 의미 구조를 형식적으로 표현합니다.시맨틱 트리뱅크는 시맨틱 표현의 깊이가 다양합니다.깊은 의미 주석의 주목할 만한 예는 그로닝언 대학에서 개발되어 담화 표현 이론을 사용하여 주석을 단 그로닝언 의미 은행이다.얕은 시맨틱 트리뱅크의 예로는 PropBank가 있는데, PropBank는 말뭉치의 모든 단어를 논리적인 형태로 표현하려고 시도하지 않고 구두 명제와 그 주장의 주석을 제공한다.

언어 트리뱅크 의미적 형식주의 배포/라이선스
중국인 중국의 보편적 명제 PropBank 의미론 CC BY-NC-SA 3.0 US
영어 추상적 의미 표현(AMR) 은행 깊은 의미론 ?
영어 프레임 네트워크 얕은 의미론 ?
영어 유니버설 개념 인지 주석(UCCA) 깊은 의미론 ?
영어 로봇 명령 트리뱅크 [5] 깊은 의미론 ?
영어 그로닝겐 의미 은행 깊은 의미론 다른 라이선스
영어 병렬 의미 뱅크 깊은 의미론 다른 라이선스
네덜란드 병렬 의미 뱅크 깊은 의미론 다른 라이선스
독일의 병렬 의미 뱅크 깊은 의미론 다른 라이선스
이탈리아의 병렬 의미 뱅크 깊은 의미론 다른 라이선스
영어 딥뱅크 프로젝트 깊은 의미론 ?
영어 Treebank 시멘틱스 구문 분석 말뭉치 깊은 의미론 ?
영어 로보컵 코퍼스 깊은 의미론 ?
영어 지오쿼리 깊은 의미론 ?
영어 프롭뱅크 PropBank 의미론 다른 라이선스
핀란드어 핀란드 보편적 명제 PropBank 의미론 CC BY-NC-SA 3.0 US
핀란드어 핀란드 프로뱅크 PropBank 의미론 CC BY-SA 4.0
프랑스 프랑스의 보편적 명제 PropBank 의미론 CC BY-NC-SA 3.0 US
독일의 독일 보편적 명제 PropBank 의미론 CC BY-NC-SA 3.0 US
이탈리아의 이탈리아 보편적 명제 PropBank 의미론 CC BY-NC-SA 3.0 US
포르투갈어 포르투갈어 PortLlex PropBank 의미론 ?
포르투갈어 포르투갈의 보편적 제안 PropBank 의미론 CC BY-NC-SA 3.0 US
스페인어 스페인 유니버설 프로포지션 PropBank 의미론 CC BY-NC-SA 3.0 US
터키어 터키 프로뱅크 PropBank 의미론 CC BY-NC-SA 4.0

구문 트리 뱅크

많은 구문 트리 뱅크가 다양한 언어용으로 개발되었습니다.

언어 트리뱅크 통사적 형식주의 배포/라이선스
아바자 유니버설 의존관계, ATB 의존 CC BY-SA
아프리칸스 보편적 의존관계, 아프리카붐 의존 CC BY-SA
아카드어 유니버설 의존관계, PISANDUB 의존 CC BY-SA
알바니아어 유니버설 의존관계, TSA 의존 CC BY-SA
암하라어 유니버설 의존관계, ATT 의존 CC BY-SA
고대 그리스어 보편적 종속성, 페르세우스 의존 CC BY-NC-SA
고대 그리스어 유니버설 의존관계, PROIEL 의존 CC BY-NC-SA
그리스어(고대) 고대 그리스 의존성 트리뱅크[6][7] 의존 오픈 소스(Creative Commons 라이선스)
그리스어(고대) 프로이엘 트리뱅크[8] 의존 오픈 소스(Creative Commons 라이선스)
아랍어 콜롬비아 아라비아 트리뱅크(CATiB) 의존 언어 데이터 컨소시엄
아랍어 프라하 아랍 의존관계 트리뱅크(PADT) 의존 언어 데이터 컨소시엄
아랍어 유니버설 의존관계(뉴욕주) 의존 CC BY-SA
아랍어 유니버설 의존관계, PADT 의존 CC BY-NC-SA
아랍어 유니버설 의존관계, PUD 의존 CC BY-SA
아랍어 펜 아라비안 트리뱅크 구 구조 언어 데이터 컨소시엄
아르메니아어 범용 의존관계, ArmTDP 의존 CC BY-SA
아시리아어(네오아람어) 유니버설 의존관계(AS) 의존 CC BY-SA
밤바라 유니버설 의존관계, CRB 의존 CC BY-SA
바스크어 유니버설 의존관계, BDT 의존 CC BY-NC-SA
벨라루스 사람 유니버설 의존관계, HSE 의존 CC BY-SA
보즈푸리 유니버설 의존관계, Bhen 의존 CC BY-SA
보즈푸리 유니버설 의존관계, BHTB 의존 CC BY-SA
브르타뉴 범용 의존관계, 외환은행 의존 CC BY-SA
불가리아어 유니버설 의존관계, BTB 의존 CC BY-NC-SA
불가리아어 벌트리 뱅크 HPSG 연구에 무료로 이용 가능
부랴트 유니버설 의존관계, BDT 의존 CC BY-SA
광둥어 유니버설 의존관계(HK) 의존 CC BY-SA
카탈로니아어 Cat3LB 구 구조 연구에 무료로 이용 가능
카탈로니아어 유니버설 의존관계, AnCora 의존 GPL
중국인 시니카 트리뱅크 대소문자 문법 무료로 이용하실 수 없습니다.
중국인 유니버설 의존관계, CFL 의존 CC BY-SA
중국인 유니버설 의존관계, GSD 의존 CC BY-SA
중국인 범용 의존관계, GSDSimp 의존 CC BY-SA
중국인 유니버설 의존관계(HK) 의존 CC BY-SA
중국인 유니버설 의존관계, PUD 의존 CC BY-SA
중국인 판차이나트리뱅크 구 구조 언어 데이터 컨소시엄
중국인 중국 의존관계 트리뱅크 의존 언어 데이터 컨소시엄
아랍어(클래식) 쿠란 아랍어 의존성 트리뱅크(QADT) (쿠란 아랍어 코퍼스) 의존 오픈 소스(GNU 일반 공중 라이선스)
고전 아르메니아어 프로이엘 트리뱅크[8] 의존 오픈 소스(Creative Commons 라이선스)
콥트어 유니버설 의존관계, 콥트 스크립트리움 의존 참조인
크로아티아어 크로아티아 종속국 트리뱅크 의존 오픈 소스(Creative Commons 라이선스)
크로아티아어 유니버설 의존관계, SET 의존 CC BY-SA
체코 프라하 종속국 트리뱅크 의존 오픈 소스(Creative Commons 라이선스)
체코 유니버설 의존관계, CAC 의존 CC BY-SA
체코 유니버설 의존관계, CLTT 의존 CC BY-SA
체코 범용 의존관계, FicTree 의존 CC BY-NC-SA
체코 유니버설 의존관계, PDT 의존 CC BY-NC-SA
체코 유니버설 의존관계, PUD 의존 CC BY-SA
덴마크어 덴마크 종속국 트리뱅크 의존 오픈 소스(GNU 일반 공중 라이선스)
덴마크어 수목원:덴마크어의 통사적 나무 말뭉치 구 구조 라이선스 요금
덴마크어 유니버설 의존관계, DDT 의존 CC BY-SA
덴마크어 유니버설 의존관계, DTB 의존 CC BY-SA
네덜란드 구어 네덜란드어 말뭉치(CGN) 구 구조 라이선스 요금
네덜란드 유니버설 의존관계, 알피노 의존 CC BY-SA
네덜란드 유니버설 의존관계, Lassy Small 의존 CC BY-SA
네덜란드 LASSY 소형 및 대형 의존 라이선스 요금
네덜란드 알피노 트리뱅크 의존 오픈 소스(GNU 일반 공중 라이선스)
영어 CCG뱅크 조합 범주형 문법 언어 데이터 컨소시엄
영어 린고 레드우드 HPSG ?
영어 랭커스터 구문 분석 말뭉치 구 구조 ?
영어 프라하 영어 의존국 트리뱅크 의존 언어 데이터 컨소시엄
영어 유니버설 의존관계, Bhen 의존 CC BY-SA
영어 유니버설 의존관계, ESL 의존 CC BY-SA
영어 유니버설 의존관계, EWT 의존 CC BY-SA
영어 유니버설 의존관계, GUM 의존 CC BY-NC-SA
영어 유니버설 의존관계, GUMReddit 의존 참조인
영어 유니버설 의존관계, LinES 의존 CC BY-NC-SA
영어 유니버설 의존관계, ParTUT 의존 CC BY-NC-SA
영어 보편적 의존관계, 대명사 의존 CC BY-SA
영어 유니버설 의존관계, PUD 의존 CC BY-SA
영어 Treebank 시멘틱스 구문 분석 말뭉치 구 구조 오픈 소스(Creative Commons 라이선스)
영어 크리스틴 코퍼스 구 구조 연구에 무료로 이용 가능
영어 루시 코퍼스 구 구조 연구에 무료로 이용 가능
영어 수잔 코퍼스 구 구조 연구에 무료로 이용 가능
영어 BLLIP WSJ 말뭉치 구 구조 언어 데이터 컨소시엄
영어 Tübingen Treebank of English / 즉흥 연설 (TüBa-E/S) HPSG 연구에 무료로 이용 가능
영어 현대 구어 영어의 디아크로닉 말뭉치(DCPSE) 구 구조 라이선스 요금
영어 국제 영어 말뭉치(ICE-GB)의 영국 구성 요소 구 구조 라이선스 요금
영어 PARC 700 의존성 은행 의존 ?
영어 야후 쿼리 트리뱅크 의존 연구에 무료로 이용 가능
영어 펜 트리뱅크 구 구조 언어 데이터 컨소시엄
영어 멀티 트리 뱅크 구 구조 비교를 위해 온라인으로 이용 가능
영어 의존성 주석이 있는 CHILDES Brown Eve 말뭉치 의존 오픈 소스(Creative Commons 라이선스)
영어 SMULTRON - 병렬 트리뱅크 EN-DE-SV 구 구조 연구에 무료로 이용 가능
엘자 유니버설 의존관계, JR 의존 CC BY-SA
에스토니아어 아르보레스트 구 구조 ?
에스토니아어 구문 분석 및 명확화 텍스트 말뭉치 의존 연구에 무료로 이용 가능
에스토니아어 유니버설 의존관계, EDT 의존 CC BY-NC-SA
에스토니아어 유니버설 의존관계, EWT 의존 CC BY-NC-SA
페로어 유니버설 의존관계, FarPaHC 의존 CC BY-SA
페로어 유니버설 의존관계, OFT) 의존 CC BY-SA
핀란드어 투르크 의존관계 트리뱅크(TDT) 의존 오픈 소스(Creative Commons 라이선스)
핀란드어 유니버설 의존관계, FTB 의존 참조인
핀란드어 유니버설 의존관계, PUD 의존 CC BY-SA
핀란드어 유니버설 의존관계, TDT 의존 CC BY-SA
프랑스어(구어) 랩소디 종속성 및 거시 구문 주석 오픈 소스(Creative Commons 라이선스)
프랑스 라보라투아르 구 구조 ?
프랑스 유니버설 의존관계, CrapBank 의존 CC BY-SA
프랑스 유니버설 의존관계, FQB 의존 GPL
프랑스 유니버설 의존관계, FTB 의존 GPL
프랑스 유니버설 의존관계, GSD 의존 CC BY-SA
프랑스 유니버설 의존관계, ParTUT 의존 CC BY-NC-SA
프랑스 유니버설 의존관계, PUD 의존 CC BY-SA
프랑스 보편적 종속성, Sequoia 의존 GPL
프랑스어 유니버설 의존관계, 음성 의존 CC BY-SA
프랑스어 프렌치 트리뱅크 구 구조 연구에 무료로 이용 가능
프랑스어 무료 프렌치 트리뱅크 구 구조 오픈 소스 라이선스 LGPL-LR
프랑스어 세쿼이아 트리뱅크 어구구조의존관계 오픈 소스 라이선스 LGPL-LR
갈리시아인 유니버설 의존관계, CTG 의존 CC BY-NC-SA
갈리시아인 유니버설 의존관계, TreeGal 의존 GPL
독일의 함부르크 의존관계 트리뱅크(HDT) 의존 연구에 무료로 이용 가능
독일의 유니버설 의존관계, GSD 의존 CC BY-SA
독일의 유니버설 의존관계, LIT 의존 CC BY-NC-SA
독일의 유니버설 의존관계, PUD 의존 CC BY-SA
독일의 SMULTRON - 병렬 트리뱅크 EN-DE-SV 구 구조 연구에 무료로 이용 가능
독일의 네그라 구 구조 연구에 무료로 이용 가능
독일의 호랑이 구 구조 연구에 무료로 이용 가능
독일의 독일어 Tübingen Treebank / 즉흥 연설 (TüBa-D/S) 구 구조 연구에 무료로 이용 가능
독일의 독일어의 Tübingen Treebank (TüBa-D/Z) 구 구조 연구에 무료로 이용 가능
독일의 튀빙겐 독일어 부분 구문 분석 말뭉치(TüPP-D/Z) 구 구조 라이선스 요금
고딕 양식 프로이엘 트리뱅크[8] 의존 오픈 소스(Creative Commons 라이선스)
고딕 양식 유니버설 의존관계, PROIEL 의존 CC BY-NC-SA
그리스어 그리스 의존성 트리뱅크 의존 무료로 이용하실 수 없습니다.
그리스어 유니버설 의존관계, GDT 의존 CC BY-NC-SA
히브리어 유니버설 의존관계, HTB 의존 CC BY-NC-SA
히브리어 히브리 의존관계 트리뱅크 의존 오픈 소스(GNU 일반 공중 라이선스)
힌디어 영어 유니버설 의존관계, HIENCS 의존 CC BY-SA
힌디어 유니버설 의존관계, HDTB 의존 CC BY-NC-SA
힌디어 유니버설 의존관계, PUD 의존 CC BY-SA
힌디어 앤코라 의존 ?
영어(이력) 역사영어 Pen Parsed Corpa 구 구조 언어 데이터 컨소시엄(2020년 4월 기준)
영어(이력) York-Toronto-Helsinki 고대 영어 산문 파서드 코퍼스(YCOE) 구 구조 연구에 무료로 이용 가능
프랑스어(역사) 코퍼스 MCVF 구 구조 연구에 무료로 이용 가능
포르투갈어(이력) 티코 브라헤 말뭉치 구 구조 ?
헝가리어 유니버설 의존관계, Szeged 의존 CC BY-NC-SA
헝가리어 헝가리 트리뱅크 구 구조 ?
아이슬란드어 IcePaHC - 아이슬란드 구문 분석 이력 코퍼스 구 구조 오픈 소스(GNU Lesser General Public License)
아이슬란드어 보편적 종속성, IcePaHC 의존 CC BY-SA
아이슬란드어 유니버설 의존관계, PUD 의존 CC BY-SA
인도네시아어 유니버설 의존관계, GSD 의존 CC BY-SA
인도네시아어 유니버설 의존관계, PUD 의존 CC BY-SA
아일랜드어 유니버설 의존관계, IDT 의존 CC BY-SA
이탈리아의 ISST - 이탈리아어 구문-시맨틱 트리뱅크 구구조의존관계 라이선스 요금
이탈리아의 TUT 및 ISST-CoNLL/TANL 트리뱅크의 Marge 및 조화로 인한 MIDT(Mergeed Italian Dependency Treebank) 의존 연구에 무료로 이용 가능
이탈리아의 VIT - 베니스 이탈리안 트리뱅크 구구조의존관계 라이선스 요금
이탈리아의 유니버설 의존관계, ISDT 의존 CC BY-NC-SA
이탈리아의 유니버설 의존관계, ParTUT 의존 CC BY-NC-SA
이탈리아의 유니버설 의존관계, PoSTWITA 의존 CC BY-NC-SA
이탈리아의 유니버설 의존관계, PUD 의존 CC BY-SA
이탈리아의 유니버설 의존관계, TWITTIRO 의존 CC BY-SA
이탈리아의 유니버설 의존관계, VIT 의존 CC BY-NC-SA
이탈리아의 CoNLL-2007 공유 태스크(ISST-CoNLL)용 이탈리아어 구문-의미 트리뱅크 의존 연구에 무료로 이용 가능
이탈리아의 수트 - 시에나 대학교 트리뱅크 ? ?
이탈리아의 TUT - Turin University Treebank 의존 오픈 소스(Creative Commons 라이선스)
이탈리아의 ISDT(이탈리아 스탠포드 의존관계 트리뱅크) 의존 연구에 무료로 이용 가능
일본인입니다 교토 텍스트 코퍼스 ? ?
일본인입니다 유니버설 의존관계, BCCWJ 의존 CC BY-NC-SA
일본인입니다 유니버설 의존관계, GSD 의존 CC BY-SA
일본인입니다 유니버설 의존관계, KTC 의존 CC BY-SA
일본인입니다 보편적 의존관계, 현대적 의존 CC BY-NC-ND
일본인입니다 유니버설 의존관계, PUD 의존 CC BY-SA
일본인입니다 케야키 트리뱅크 구 구조 오픈 소스(Creative Commons 라이선스)
일본인입니다 일본어 Tübingen Treebank / 즉흥연설 (TüBa-J/S) 구 구조 연구에 무료로 이용 가능
일본인입니다 ATR 의존성 말뭉치 의존 ?
카렐리아어 유니버설 의존관계, KKPP 의존 CC BY-SA
카자흐스탄어 유니버설 의존관계, KTB 의존 CC BY-SA
코미 페르미약 유니버설 의존관계(UH) 의존 CC BY-SA
코미 지리안 유니버설 의존관계, IKDP 의존 CC BY-SA
코미 지리안 범용 종속성, 격자 의존 CC BY-SA
한국인입니다 유니버설 의존관계, GSD 의존 CC BY-SA
한국인입니다 Kaist, 유니버설 종속성 의존 CC BY-SA
한국인입니다 유니버설 의존관계, 펜실베이니아주 의존 CC BY-SA
한국인입니다 유니버설 의존관계, PUD 의존 CC BY-SA
한국인입니다 보편적 종속성, 세종 의존 CC BY-SA
한국인입니다 코리안트리뱅크 구 구조 언어 데이터 컨소시엄
쿠만지 유니버설 의존관계, MG 의존 CC BY-SA
라틴어 유니버설 의존관계, ITTB 의존 CC BY-NC-SA
라틴어 유니버설 의존관계, LLCT 의존 CC BY-SA
라틴어 보편적 종속성, 페르세우스 의존 CC BY-NC-SA
라틴어 유니버설 의존관계, PROIEL 의존 CC BY-NC-SA
라틴어 토미시스쿠스 트리뱅크 의존 오픈 소스(Creative Commons 라이선스)
라틴어 프로이엘 트리뱅크[8] 의존 오픈 소스(Creative Commons 라이선스)
라틴어 라틴 종속성 트리뱅크[9] 의존 오픈 소스(Creative Commons 라이선스)
라트비아어 유니버설 의존관계, LVTB 의존 CC BY-SA
리투아니아어 유니버설 의존관계, ALKSNIS 의존 CC BY-SA
리투아니아어 유니버설 의존관계, HSE 의존 CC BY-SA
리비 유니버설 의존관계, KKPP 의존 CC BY-SA
마가히 유니버설 의존관계, MGTB 의존 CC BY-SA
몰타어 범용 종속성, MUDT 의존 CC BY-SA
마라티 유니버설 의존관계, UFAL 의존 CC BY-SA
음비아 과라니 유니버설 의존관계, Dully 의존 CC BY-NC-SA
음비아 과라니 유니버설 의존관계, 토마스 의존 CC BY-NC-SA
중세 아일랜드어 유니버설 의존관계, CritMITB 의존 CC BY-SA
중세 아일랜드어 유니버설 의존관계, DipMITB 의존 CC BY-SA
목사 유니버설 의존관계, JR 의존 CC BY-SA
나이자 유니버설 의존관계, NSC 의존 CC BY-SA
노스사미 범용 의존관계(Giella) 의존 CC BY-SA
노르웨이어 INESS 트리뱅킹 인프라스트럭처 LFG ?
노르웨이어 보편적 의존관계, 복마알 의존 CC BY-SA
노르웨이어 유니버설 의존관계(Nynorsk) 의존 CC BY-SA
노르웨이어 유니버설 의존관계(Nynorsk)리아 의존 CC BY-SA
구교회 슬라브어 유니버설 의존관계, PROIEL 의존 CC BY-NC-SA
구교회 슬라브어 토로트 트리뱅크[8] 의존 오픈 소스(Creative Commons 라이선스)
옛 프랑스어 유니버설 의존관계, SRCMF 의존 CC BY-NC-SA
고대 러시아어 유니버설 의존관계, RNC 의존 CC BY-SA
고대 러시아어 범용 의존관계, TOROT 의존 CC BY-NC-SA
고대 러시아어 토로트 트리뱅크[8] 의존 오픈 소스(Creative Commons 라이선스)
페르시아어 페르시아 의존관계 트리뱅크(PerDT) 의존 연구에 무료로 이용 가능
페르시아어 퍼트리 뱅크 HPSG 연구에 무료로 이용 가능
페르시아어 유니버설 의존관계, Seraji 의존 CC BY-SA
폴란드의 폴란드어용 트리뱅크/테스트 스위트 HPSG ?
폴란드의 유니버설 의존관계, LFG 의존 GPL
폴란드의 유니버설 의존관계, PDB 의존 CC BY-NC-SA
폴란드의 유니버설 의존관계, PUD 의존 CC BY-SA
폴란드의 스콰드니차 구구조의존관계 오픈 소스(GNU 일반 공중 라이선스)
포르투갈어 범용 의존관계, Bosque 의존 CC BY-SA
포르투갈어 유니버설 의존관계, GSD 의존 CC BY-SA
포르투갈어 유니버설 의존관계, PUD 의존 CC BY-SA
포르투갈어 프로젝토 플로레스타 신타(c)티카 종속성, 구 구조 오픈 소스(GNU 일반 공중 라이선스)
루마니아어 루마니아 종속국 트리뱅크 의존 ?
루마니아어 유니버설 의존관계, 비표준 의존 CC BY-SA
루마니아어 유니버설 의존관계, RRT 의존 CC BY-SA
루마니아어 유니버설 의존관계, SiMoNERO 의존 CC BY-SA
러시아어 유니버설 의존관계, GSD 의존 CC BY-SA
러시아어 유니버설 의존관계, PUD 의존 CC BY-SA
러시아어 유니버설 의존관계, SynTagRus 의존 CC BY-NC-SA
러시아어 유니버설 의존관계(Taiga) 의존 CC BY-SA
러시아어 SynTagRus 의존관계 트리뱅크(러시아 국가 코퍼스) 의존 연구에 무료로 이용 가능
산스크리트어 유니버설 의존관계, UFAL 의존 CC BY-SA
산스크리트어 유니버설 의존관계, Vedic 의존 CC BY-SA
스코틀랜드 게일어 범용 의존관계, ARCOSG 의존 CC BY-SA
세르비아어 유니버설 의존관계, SET 의존 CC BY-SA
신디 보편적 종속성, MazharDootio 의존 CC BY-SA
스콜트 사미 Giellagas의 유니버설 의존 관계 의존 CC BY-SA
슬로바키아어 유니버설 의존관계, SNK 의존 CC BY-SA
슬로베니아 슬로베니아 종속국 트리뱅크 의존 연구에 무료로 이용 가능
슬로베니아어 유니버설 의존관계, SSJ 의존 CC BY-NC-SA
슬로베니아어 유니버설 의존관계, SST 의존 CC BY-NC-SA
스페인어 캐스트 3LB 구구조의존관계 연구에 무료로 이용 가능
스페인어 유니버설 의존관계, AnCora 의존 GPL
스페인어 유니버설 의존관계, GSD 의존 CC BY-SA
스페인어 유니버설 의존관계, PUD 의존 CC BY-SA
스페인어 스페인어 UAM 트리뱅크 구 구조 연구에 무료로 이용 가능
스웨덴어 탈방켄05 구구조의존관계 연구에 무료로 이용 가능
스웨덴어 스웨덴 트리뱅크 구 구조 연구에 무료로 이용 가능
스웨덴어 유니버설 의존관계, LinES 의존 CC BY-NC-SA
스웨덴어 유니버설 의존관계, PUD 의존 CC BY-SA
스웨덴어 유니버설 의존 관계, Talbanken 의존 CC BY-SA
스웨덴어 SMULTRON - 병렬 트리뱅크 EN-DE-SV 구 구조 연구에 무료로 이용 가능
스웨덴 수화 유니버설 의존관계, SSLC 의존 CC BY-SA
스위스 독일어 유니버설 의존관계, UZH 의존 CC BY-SA
타갈로그어 유니버설 의존관계, TRG 의존 CC BY-SA
타갈로그어 유니버설 의존 관계, Ugnayan 의존 CC BY-NC-SA
타밀어 유니버설 의존관계, TTB 의존 CC BY-NC-SA
텔루구 유니버설 의존관계, MTG 의존 CC BY-SA
태국어 NAiST 타이 트리뱅크 의존 오픈 소스(GNU 일반 공중 라이선스)
태국어 유니버설 의존관계, PUD 의존 CC BY-SA
터키어 METU-Sabanci 터키 트리뱅크 의존 연구에 무료로 이용 가능
터키어 유니버설 의존관계, BOUN 의존 CC BY-SA
터키어 유니버설 의존관계(GB) 의존 CC BY-SA
터키어 유니버설 의존관계, IMST 의존 CC BY-NC-SA
터키어 유니버설 의존관계, PUD 의존 CC BY-SA
우크라이나어 비정부기구(NGO) 금본위제 우크라이나어 연구소 의존 오픈 소스(Creative Commons 라이선스)
우크라이나어 유니버설 의존관계, IU 의존 CC BY-NC-SA
상부 소르브어 유니버설 의존관계, UFAL 의존 CC BY-SA
우르두어 NU-FAST 트리뱅크 구 구조 컴퓨터 학습 전략 및 실습 연락처
우르두어 URDU.KON-TB 트리뱅크 문구와 하이퍼 의존 관계 구조 컴퓨터 학습 전략 및 실습 연락처
우르두어 유니버설 의존관계, UDTB 의존 CC BY-NC-SA
위구르족 유니버설 의존관계, UDT 의존 CC BY-SA
베트남의 유니버설 의존관계, VTB 의존 CC BY-SA
베트남의 베트남 트리뱅크 구 구조 연구에 무료로 이용 가능
베트남의 베트남 의존관계 트리뱅크 의존 연구에 무료로 이용 가능
월피리 유니버설 의존관계, UFAL 의존 CC BY-SA
웨일스어 유니버설 의존관계, CCG 의존 CC BY-SA
월로프 유니버설 의존관계, WTB 의존 CC BY-SA
요루바 유니버설 의존관계, YTB 의존 CC BY-SA

다국어 과제 간의 추가 연구를 촉진하기 위해, 일부 연구자들은 교차 언어에 대한 보편적인 주석 체계를 논의했다.이런 식으로 사람들은 다양한 나무둑 코퍼라의 장점을 활용하거나 결합하려고 한다.예를 들어 종속성 트리뱅크에 [10]대한 범용 주석 접근법, 구문 구조 트리뱅크에 [11]대한 범용 주석 접근법 등이 있습니다.

검색 도구

트리뱅크에서 증거를 추출하는 주요 방법 중 하나는 검색 도구를 사용하는 것입니다.구문 분석된 말뭉치에 대한 검색 도구는 일반적으로 말뭉치에 적용된 주석 체계에 따라 달라집니다.사용자 인터페이스는 컴퓨터 프로그래머를 대상으로 한 표현식 기반 쿼리 시스템에서 일반 언어학자를 대상으로 한 완전한 탐색 환경까지 정교하게 구성되어 있습니다.Wallis(2008)는 트리뱅크 검색의 원리를 자세히 논의하고 그 [12]무렵의 최신 기술을 검토한다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ 알렉산더 클라크, 크리스 폭스, 샬롬 라핀(2010).컴퓨터 언어학 및 자연어 처리 핸드북.와일리.
  2. ^ 샘슨, G. (2003) '덴드로그래퍼의 반사'A. Wilson, P. Rayson, T. McEnery (에드)에서.말뭉치 언어학 by the Lune: Festschrift for Geoffrey Lich, 프랑크푸르트 암 메인: Peter Lang, 페이지 157-184
  3. ^ Wei Huang의 Haitao Liu - 중국 통신대학에서 발행한 트리뱅킹의 중국어 의존관계 구문, 계산언어학 협회에서 발행(온라인) - 접속 2020-2-4
  4. ^ Kübler, Sandra; McDonald, Ryan; Nivre, Joakim (2008-12-18). "Dependency Parsing". Synthesis Lectures on Human Language Technologies. 2 (1): 1–127. doi:10.2200/s00169ed1v01y200901hlt002.
  5. ^ Kais Dukes(2013) 로봇 공간 명령의 의미 주석.LTC(Language and Technology Conference)폴란드 포즈난
  6. ^ Celano, Giuseppe G.고대 그리스 의존성 트리뱅크 2.0 주석 가이드라인 https://github.com/PerseusDL/treebank_data/edit/master/AGDT2/guidelines
  7. ^ 맘브리니, F. 2016고대 그리스 의존성 트리뱅크:교육 환경에서의 언어 주석.입력: Bodard, G & Romanello, M (eds)에코 챔버 외부의 디지털 클래식:교육, 지식 교류 및 공공 참여, 페이지 83~99런던: 유비쿼티 프레스.doi: 10.5334/bat.f
  8. ^ a b c d e f Dag Haug, 2015년역사 언어 연구의 나무둑.카를로타 비티(ed.), 벤자민스 역사구문에 관한 관점, 188-202.프리프린트는 http://folk.uio.no/daghaug/historical-treebanks.pdf 에서 구할 수 있습니다.
  9. ^ Bamman David & al. 2008.라틴 트리뱅크 구문 주석 가이드라인(1.3절).http://nlp.perseus.tufts.edu/syntax/treebank/1.3/docs/guidelines.pdf
  10. ^ McDonald, R.; Nivre, J., Quirmbach-Brundage, Y.; et al. "Universal Dependency Annotation for Multilingual Parsing.". Proceedings of the ACL 2013.{{cite conference}}: CS1 maint: 여러 이름: 작성자 목록(링크)
  11. ^ Han, A.L.-F; Wong, D.F.; Chao, L.S.; Lu, Y.; He, L. & Tian, L. (2014). "A Universal Phrase Tagset for Multilingual Treebanks" (PDF). Proceedings of the CCL and NLP-NABD 2014, LNAI 8801, pp. 247– 258. © Springer International Publishing Switzerland. doi:10.1007/978-3-319-12277-9_22.
  12. ^ 월리스, 션(2008년).나무 제방과 다른 구조화된 말뭉치를 수색하고 있습니다.Lüdeling, A. & Kytö, M. (ed.) 코퍼스 언어학: 국제 핸드북Handbücher zur Sprache und Kommunicationswissenschaft 시리즈.베를린:무통 드 그루이터.