• 제목/요약/키워드: 형태문법

검색결과 197건 처리시간 0.029초

인터넷 지리 정보 시스템을 위한 HVF (Hnagul Vector Format)의 개발 (A Development of HVF (Hnagul Vector Format) for Internet GIS)

  • 문진용;구용완
    • 한국정보처리학회논문지
    • /
    • 제7권2호
    • /
    • pp.321-327
    • /
    • 2000
  • 지리 정보 시스템(GIS; Geographical Information System)은 하드웨어, 소프트웨어, 데이터, 사람, 그리고 메소드로 구성된다. 이중 데이터는 GIS 의 가장 중요한 요소 중 하나이다. 본 논문에서는 GIS 개발자들에 의해 개척되고 있는 최신의 기술인 인터넷 GIS에서 공간 데이터의 효율적 사용을 위한 공간 객체 표현, 저장 및 전송을 위한 파일 포맷인 HVF를 개발하였다. 본 논문에서는 먼저 HVF의 문법을 정의하고, API를 통한 HVF 생성을 위해 헤드섹션 생성모듈과 메인섹션 생성모듈을 구현하였다. 그리고 HVF를 여러 응용 분야에서 데이터의 공유가 가능한 자료 구조의 형태로 변환하기 위해 HVF를 위한 공간객체 변환기를 개발하였다. 이를 위해 변환기를 구성하는 3개의 단위 모듈인 파일 처리 모듈, HVF 수입 모듈, 그리고 HVF 수출 모듈들을 설계 및 구현하였다. 특히, 인터넷 GIS를 위해 개발된 HVF는 네트워크의 트래픽을 감소하기 위한 공간 데이터의 크기와 이용 효율을 위한 한글 처리에 대해 고려 하였다.

  • PDF

한국어 대인관계 단어의 친숙성과 적절성에 관한 연구 (A Study on the Familiarity and Appropriateness of Korean Interpersonal Words)

  • 장혜진;김영근
    • 감성과학
    • /
    • 제24권3호
    • /
    • pp.91-114
    • /
    • 2021
  • 본 연구는 한국어 대인관계 단어 도구를 제작하는 것으로, 그 첫 과정으로서 대인관계 단어 목록에 포함시킬 적절한 단어를 수집하는 것이 매우 중요하다. 먼저, 생소하지만 의미를 짐작해볼 수 있고 대인관계를 나타내는 것으로 판단되는 모든 어휘를 3종의 국어사전으로부터 수집하였다. 그 결과, 총 2,725개의 단어로 구성된 대인관계 단어 총집을 제작하였고, 중복되는 단어를 선별하여 총 910개의 단어를 선정하였다. 그 중에서도 문법적인 형태가 다를 뿐, 의미가 비슷하거나 동일한 단어가 발견되어 이를 반영한 재분류 작업이 요구되었다. 이러한 절차는 총 7회 반복하여 실시하였으며 그 결과, 총 249개의 단어를 선별하였다. 한편, 대표 단어 도구를 개발하는 본 연구의 특성 상, 단어의 의미가 보다 구체화되고 집약되어 전체적인 대인관계 양상을 하나로 잘 나타낼 수 있는 단어 구성이 필요하므로, 단어의 수를 축약시킬 필요가 있었다. 따라서 단어 선별의 마지막 단계로, 앞서 추출한 총 249개의 대인관계 단어에 대한 친숙성과 적절성 평가에 따라 재선별하는 절차를 수행한 후, 친숙성과 적절성의 평정치 결과가 서로 공통적으로 가장 높게 나타난 단어들을 최종적으로 선별하였다.

일한기계번역에서 진행형 "ている"의 번역처리 (A Processing of Progressive Aspect "te-iru" in Japanese-Korean Machine Translation)

  • 김정인;문경희;이종혁
    • 정보처리학회논문지B
    • /
    • 제8B권6호
    • /
    • pp.685-692
    • /
    • 2001
  • 본 논문은 일한기계번역에서 일본어 진행표현 "ている" 형태로부터 한국어 대역어의 선정과정에서 발생하는 애매성을 해소하기 위하여 연구한 것이다. 대부분의 일한 기계번역 시스템은 양궁어의 문법적인 유사엉에 기초하여 어휘적인 단계의 처리만으로 고품질의 번역이 가능한 직접 번역방식을 채용하고 있다. 그러나, 직접 번역방식에 기초한 일한 기계번역에서는 술부에 존재하는 "ている"형태의 상적인 의미를 구별할 수 있는 방법론이 아직 제안되지 않았다. 일본어에서 "ている"형태는 동작진행과 상태진행을 모두 나타내지만 한국어에서는 "고 있다."와 "어 있다."로 나누어 표기한다. 양 언어간의 상적인 의미 대응은 간단하지 않지만, 술부의 의미 정보, 부사와 부사어의 의미정보 등을 이용하여 "ている"형태의 상적인 의미를 결정하는 것이 가능하다. "ている"형태의 적절한 대역어 선정을 위하여, 사전 속의 모든 일본어 술어에 다섯 종류의 의미코드를 입력한다. 즉 "1:동작진행만으로 사용되는 술어", "2: 일반적으로는 동작진행으로 사용되지만, 수동인 경우에는 상태진행의 형태로도 사용되는 술어", "3: 상태진행으로만 사용되는 술어", "4: 동작진행, 상태진행의 구별이 애매한 술어", "5: 기타" 당의 상적인 의미분류코드를 술어별로 입력한다. 그리고 "2","4"형태의 술어로부터 진행형은 구별하기 위하여 부사와 부사어를 사용하는 방법을 제안한다. 실험에는 아사히 신문의 기사 중에서 임의로 약 15,000문을 추출하여 이용하였다. 제안한 방법은 실험문장에서 83.6%의 성공률을 보였으며 단순히 동작진행과 상태진행, 기타만으로 나누어 처리하던 종전 시스템에 비하여 약 5.7%정도 더 좋은 결과가 얻어졌다.아사히 신문의 기사 중에서 임의로 약 15,000문을 추출하여 이용하였다. 제안한 방법은 실험문장에서 83.6%의 성공률을 보였으며 단순히 동작진행과 상태진행, 기타만으로 나누어 처리하던 종전 시스템에 비하여 약 5.7%정도 더 좋은 결과가 얻어졌다.

  • PDF

게임 원작의 성공적인 각색 (Toward Successful Adaptation from Games to Films)

  • 박수진;송승근
    • 한국게임학회 논문지
    • /
    • 제11권1호
    • /
    • pp.3-14
    • /
    • 2011
  • 최근 하나의 원천 콘텐츠가 다른 형태의 다양한 콘텐츠로 제작되는 사례가 빈번하다. 그러나 한번 성공한 콘텐츠가 다른 형태의 매체로 제작 되었을 때 과연 성공 할 수 있을까? 이에 대한 정확한 답을 하기는 어려울 것이다. 왜냐하면 다른 콘텐츠로 변환 되었을 때 해당 콘텐츠 특성에 대한 분명한 이해가 있어야 하기 때문이다. 이렇듯 성공한 게임 원작 영화가 극소수인 상황속에서 이러한 성공 요인에 대한 충분한 연구가 이루어지지 않고 있다. 본 연구는 영상과 서사적 측면에서 성공한 게임 원작 영화의 공통된 성공요인을 살펴보는 것을 목적으로 한다. 그 결과 성공한 게임원작 영화는 영화적인 임팩트를 위한 단순화, 압축, 제거 등을 통해 스토리텔링에 성공한 각색이 있으며, 게임 아바타의 재현에 대한 충족감과 성공한 게임 본연의 매력 포인트를 잘 찾아 영화 문법에 잘 녹아들게 했다는 공통점이 있다. 본 연구는 성공한 게임 원작 영화의 사례를 통해 게임 원작 영화의 성공 요인을 분석하여 앞으로 제작될 영화들의 실패할 확률을 줄이는 데 기여하고자 한다.

다국어 범용 의존관계 주석체계(Universal Dependencies) 적용 연구 - 한국어와 일본어의 비교를 중심으로 (A Case Study on Universal Dependency Tagsets)

  • 한지윤;이진;이찬영;김한샘
    • 비교문화연구
    • /
    • 제53권
    • /
    • pp.163-192
    • /
    • 2018
  • 이 논문은 형태통사적 특성이 유사한 한국어와 일본어의 다국어 범용 의존관계 주석체계(Universal Dependencies, 이하 UD) 적용 사례를 살펴보고 비교 분석을 통해서 한국어의 UD 적용 및 개선 방안을 고찰하는 것을 목적으로 한다. 한국어와 일본어는 교착어적 특성으로 인하여 어미와 조사가 매우 발달되어 있다. 그러므로 영어와 같은 굴절어를 중심으로 설계된 UD를 적용하는 데에 많은 어려움이 있다. 이에 본고에서는 UD를 구성하는 범용 품사 주석(Universal POS, 이하 UPOS)과 범용 의존관계 주석(Universal Dependency Relations, 이하 DEPREL)의 적용과 그에 따른 논의들을 검토하였다. UPOS의 경우 AUX(조동사 표지), ADJ(형용사 표지), VERB(동사 표지)처럼 서술어와 관련된 주석 표지의 처리와 조사, 어미와 같은 기능어의 처리 방안을 살펴보았으며 접속사 및 이와 관련된 단위를 어떻게 처리하고 있는지 검토하였다. DEPREL과 관련해서는, 구문 표지를 주석하는 기본 단위의 문제에서 출발하여 통사적 문제를 어떻게 반영하고 있는지 살펴보았다. 지배소 설정 방식과 병렬 구조의 주석 방식, case(격 관계 표지)와 aux(조동사 관계 표지) 주석 방식을 검토하였다. 다양한 관계 주석 표지 중에서 특히 case와 aux에 집중하여 논의한 것은 한국어와의 주석 표지 적용 양상을 비교했을 때 분포 상 가장 두드러지는 차이를 나타내기 때문이다. case는 한국어와 일본어 모두 조사와 관련이 있고, aux는 한국어에서는 보조용언, 일본어에서는 조동사와 관련이 있는 표지이다. 구체적인 주석 양상을 살펴본 결과 일본어의 aux는 서법 조동사뿐만 아니라 동사에 문법적 의미를 더하는 요소, 한국어의 어미에 해당하는 형태에도 aux를 할당하기 때문에 주석이 차지하는 비율이 크게 차이가 나는 것으로 밝혀졌다. iobj(간접목적어 관계 표지)와 관련해서는 일본어에서 간접목적어를 인정하는 데에 반해 한국어에서는 간접목적어를 인정하지 않는 경우가 더 많았다. 일본어의 UD 주석에서 형태 분석 기본 단위인 '단단위'를 기본 구문 주석 단위로 하되 '장단위'와 문절 정보를 이용하는 것처럼, 한국어에서도 형태 분석 단위를 의존관계 주석의 정보로 활용하는 방안에 대해서 고려할 필요가 있다.

VR 카툰의 스토리텔링 연구 (Study on Storytelling of VR Cartoons)

  • 유태경
    • 방송공학회논문지
    • /
    • 제23권1호
    • /
    • pp.45-52
    • /
    • 2018
  • VR 카툰은 웹툰의 간명한 스토리와 칸을 이용한 그래픽 스토리텔링을 VR 콘텐츠 디자인의 한계를 극복하는 전략으로 활용한 VR 콘텐츠 포맷이다. VR 프로토타이핑을 통해 웹툰 콘텐츠를 VR로 전환하여 웹툰 상의 3차원 공간에 실제 존재하는 듯 한 체험을 가능하게 하였다. 기존 VR 콘텐츠에 비해 어지럽지 않게 관람 가능하고 몰입이 잘 된다는 평균적인 피드백을 받을 수 있었다. 우리는 영화 스크린을 통해 스토리를 이해하는 데 익숙한 거처럼 그 동안의 출판 만화와 웹툰들을 통해 만화의 스토리텔링에 익숙해져 있다. 즉, 칸이라는 평면적 공간을 바꿔 가며 연속된 시각 이미지들을 통해 스토리를 전달하는 것은 우리에게는 보편화 된 커뮤니케이션 방법이다. 시간과 공간을 분할하는 만화의 칸 사이에는 아무것도 보이지 않는 홈통만이 존재하지만 우리는 경험에 의한 완결성 연상을 하게 된다. 바로 이러한 만화의 문법이 VR 카툰에서 차용하게 된 가장 핵심적인 스토리텔링 기법이다. 본고에서는 웹툰의 스토리텔링이 어떤 형태로 VR 카툰의 스토리텔링으로 전환 되었는지를 살펴보고 VR 카툰의 요소들을 분석해 본다. 이 연구를 통해 무한한 가능성을 가진 '연속 예술', 만화를 비롯한 다양한 서사 매체들의 특성을 VR 콘텐츠 제작에 접목하는 시도의 기반 연구로서 역할을 할 수 있기를 기대한다.

판타지 만화의 컨벤션 연구 (A Study on Convention of the Fantasy Cartoon)

  • 김성재;손기환
    • 만화애니메이션 연구
    • /
    • 통권38호
    • /
    • pp.195-216
    • /
    • 2015
  • '컨벤션(Convention)'은 사전적 의미로 관습과 관례를 뜻하는 말로, 장르관습을 뜻한다. 독자는 장르가 지니는 일정한 패턴과 문법에 친숙함을 느끼고, 그 '뻔함' 속에서 다음을 예측하고 기대하며 작품에 참여한다. 그래서 대중을 대상으로 하는 대중 예술은 모두 장르관습, 즉 컨벤션을 가지고 있다. 만화도 예외는 아니다. 만화는 '스포츠 만화', '추리 만화', 순정 만화' 등 장르의 호칭만으로 법칙이 떠오를 만큼 컨벤션이 가장 발단한 대중 예술 중 하나이다. 그런데 판타지 만화는 오랫동안 사랑 받아온 장르임에도 불구하고, 컨벤션에 대한 연구가 거의 되어 있지 않은 만화 장르 중 하나이다. 판타지 만화의 컨벤션 연구가 부족한 데는 여러 가지 이유가 있다. 그러나 가장 근본적인 이유는 기초적인 개념 규정이 제대로 되어 있지 않기 때문일 것이다. 선행연구 중에는 환상문학의 연장선상에서 판타지 만화를 규정하고 유형을 나누고 있는 것도 있으나, 지나치게 넓은 범주로 인해 판타지 만화만의 컨벤션을 분석해 내기 힘들다. 그래서 본 연구에서는 J.R.R. 톨킨의 <반지의 제왕>이 판타지 소설과 판타지 만화의 장르관습을 만들었다고 보고, 판타지 만화의 개념과 유형을 분류하였다. 그리고 다양한 사례 분석을 통해, 판타지 만화의 컨벤션을 6가지 형태로 규명하였다. 장르는 완성형이 아니다. 장르는 세분화되어 분화하고, 다른 장르와 합쳐져서 새로운 장르를 만들기도 한다. 그렇기 때문에 특정 장르의 장르 관습을 연구하는 데는 늘 한계가 존재한다. 본 연구 또한 일반적인 판타지 만화의 컨벤션만을 제시하고 있어 한계가 있음을 미리 밝힌다.

품사 정보와 템플릿을 이용한 문장 축소 방법 (A Sentence Reduction Method using Part-of-Speech Information and Templates)

  • 이승수;염기원;박지형;조성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권5호
    • /
    • pp.313-324
    • /
    • 2008
  • 문장 축소란 원본 문장의 기본적인 의미를 유지하면서 불필요한 단어나 구를 제거하는 일련의 정보 압축 과정을 의미한다. 기존의 문장 축소에 관한 연구들은 학습 과정에서 대량의 어휘나 구문적 자원을 필요로 하였으며, 복잡한 파싱 과정을 통해서 불필요한 문장의 구성원(예를 들어, 단어나 구, 절 등)들을 제거하여 문장을 요약하였다. 그러나 학습 데이타로부터 얻을 수 있는 어휘적 자원은 매우 한정적이며, 문장의 모호성과 예외적인 표현들 때문에 구문 분석 결과가 명료하게 제공되지 않은 언어에서는 문장 요약이 용이하지 않다. 이에 본 논문에서는 구문 분석을 대체하기 위한 방법으로 템플릿과 품사 정보를 이용한 문장 축소 방법을 제안한다. 제안하는 방법은 요약문의 구조적 형태를 결정하기 위한 문장 축소 템플릿(Sentence Reduction Templates)과 문법적으로 타당한 문장 구조를 구성하는 품사기반 축소규칙(Grammatical POS-based Reduction Rules)을 이용하여 요약 대상 문장의 구성을 분석하고 요약한다. 더불어, 문장 축소 템플릿 적용 시 발생하는 연산량 증가 문제를 은닉 마르코프 모델(HMM: Hidden Markov Model)의 비터비 알고리즘(Viterbi Algorithm)을 이용하여 효과적으로 처리한다. 마지막으로, 본 논문에서 제안한 문장 축소 방법의 결과와 기존 논문의 연구 결과를 비교 및 평가함으로써 제안하는 문장 축소 방법의 유용성을 확인한다.

구문분석에 기반한 한글 자연어 질의로부터의 불리언 질의 생성 (Boolean Query Formulation From Korean Natural Language Queries using Syntactic Analysis)

  • 박미화;원형석;이근배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권10호
    • /
    • pp.1219-1229
    • /
    • 1999
  • 일반적으로 AND, OR, NOT과 같은 연산자를 사용하는 불리언 질의는 사용자의 검색의도를 정확하게 표현할 수 있기 때문에 검색 전문가들은 불리언 질의를 사용하여 높은 검색성능을 얻는다고 알려져 있지만, 일반 사용자는 자신이 원하는 정보를 불리언 형태로 표현하는데 익숙하지 않다. 본 논문에서는 검색성능의 향상과 사용자 편의성을 동시에 만족하기 위하여 사용자의 자연어 질의를 확장 불리언 질의로 자동 변환하는 방법론을 제안한다. 먼저 자연어 질의를 범주문법에 기반한 구문분석을 수행하여 구문트리를 생성하고 연산자 및 키워드 정보를 추출하여 구문트리를 간략화한다. 다음으로 간략화된 구문트리로부터 명사구를 합성하고 키워드들에 대한 가중치를 부여한 후 불리언 질의를 생성하여 검색을 수행한다. 또한 구문분석의 오류로 인한 검색성능 저하를 최소화하기 위하여 상위 N개 구문트리에 대해 각각 불리언 질의를 생성하여 검색하는 N-BEST average 방법을 제안하였다. 정보검색 실험용 데이타 모음인 KTSET2.0으로 실험한 결과 제안된 방법은 수동으로 추출한 불리언 질의보다 8% 더 우수한 성능을 보였고, 기존의 벡터공간 모델에 기반한 자연어질의 시스템에 비해 23% 성능향상을 보였다. Abstract There have been a considerable evidence that trained users can achieve a good search effectiveness through a boolean query because a structural boolean query containing operators such as AND, OR, and NOT can make a more accurate representation of user's information need. However, it is not easy for ordinary users to construct a boolean query using appropriate boolean operators. In this paper, we propose a boolean query formulation method that automatically transforms a user's natural language query into a extended boolean query for both effectiveness and user convenience. First, a user's natural language query is syntactically analyzed using KCCG(Korean Combinatory Categorial Grammar) parser and resulting syntactic trees are structurally simplified using a tree-simplifying mechanism in order to catch the logical relationships between keywords. Next, in a simplified tree, plausible noun phrases are identified and added into the same tree as new additional keywords. Finally, a simplified syntactic tree is automatically converted into a boolean query using some mapping rules and linguistic heuristics. We also propose an N-BEST average method that uses top N syntactic trees to compensate for bad effects of single incorrect top syntactic tree. In experiments using KTSET2.0, we showed that a proposed method outperformed a traditional vector space model by 23%, and surprisingly manually constructed boolean queries by 8%.

인도의 언어이론과 파니니 (Linguistic Theory in India and Panini)

  • 김형엽
    • 인문언어
    • /
    • 제1권2호
    • /
    • pp.123-139
    • /
    • 2001
  • In the history of linguistics in the world the scholars in India could be regarded as the representative linguists, who had provided the cornerstone of the academic development at linguistics. Without looking into the contents of Indian linguistic theories devised and developed in the past it would be almost impossible to account for the origin of descriptive linguistics and historical linguistics. These linguistics trends became full-fledged in 19 and 20 century and are still accepted by a lot of researchers in order to analyze newly revealed languages and train students only coming up the toddling level of linguistic studies. In this paper I will show how far the influence of Indian linguistics has colored the flow of linguistic growth historically. Especially through the analysis of Panini grammar I will prove the intimate relationship between the Indian linguistic theory and the generative grammar - it is the most active theory at present. The methods that Panini applied to constitute the rules like sutra include lots of information, that also could be discovered at the rules postulated in the generative grammar. One of the common features found at both linguistic theories is the simplicity of rule representation. At the generative grammar a rule has to be established without any redundancy. When certain number of sounds like p, b, m show the same phonological. change relevant to lips (labial in linguistic term) different rules need not to be given for each sound separately. It is better to find a way of putting the sounds together in a rule with grouping the 3 sounds with the shared phonetic feature 'labial'. In Panini grammar the form of a rule was decided based on the simplicity, too. For example, sutra 6.1.77 shows the phonological connection between the vowels i, u r 1 and the semi-vowels y, v, r, 1. However, it does not require to postulate 4 individual rules respectively. Instead a rule in which the vowels and the semi-vowels are involved is suggested, and linguistically the rule make it clear that the more simpler the rules will be the better they can reflect the efficiency of human language acquisition. Although the systems introduced at Panini grammar have some sense of distance from the language education itself we cannot deny the fact that the grammar formulates the a turning point of linguistic development. It is essential for us to think over the grammar from the view point of the modem linguistic theories to understand their root and trunk more thoroughly. It will also help us to predict in which way linguistic tendency will proceed to in future.

  • PDF