• 제목/요약/키워드: Syntactic Analysis

검색결과 261건 처리시간 0.026초

다국어 범용 의존관계 주석체계(Universal Dependencies) 적용 연구 - 한국어와 일본어의 비교를 중심으로 (A Case Study on Universal Dependency Tagsets)

  • 한지윤;이진;이찬영;김한샘
    • 비교문화연구
    • /
    • 제53권
    • /
    • pp.163-192
    • /
    • 2018
  • 이 논문은 형태통사적 특성이 유사한 한국어와 일본어의 다국어 범용 의존관계 주석체계(Universal Dependencies, 이하 UD) 적용 사례를 살펴보고 비교 분석을 통해서 한국어의 UD 적용 및 개선 방안을 고찰하는 것을 목적으로 한다. 한국어와 일본어는 교착어적 특성으로 인하여 어미와 조사가 매우 발달되어 있다. 그러므로 영어와 같은 굴절어를 중심으로 설계된 UD를 적용하는 데에 많은 어려움이 있다. 이에 본고에서는 UD를 구성하는 범용 품사 주석(Universal POS, 이하 UPOS)과 범용 의존관계 주석(Universal Dependency Relations, 이하 DEPREL)의 적용과 그에 따른 논의들을 검토하였다. UPOS의 경우 AUX(조동사 표지), ADJ(형용사 표지), VERB(동사 표지)처럼 서술어와 관련된 주석 표지의 처리와 조사, 어미와 같은 기능어의 처리 방안을 살펴보았으며 접속사 및 이와 관련된 단위를 어떻게 처리하고 있는지 검토하였다. DEPREL과 관련해서는, 구문 표지를 주석하는 기본 단위의 문제에서 출발하여 통사적 문제를 어떻게 반영하고 있는지 살펴보았다. 지배소 설정 방식과 병렬 구조의 주석 방식, case(격 관계 표지)와 aux(조동사 관계 표지) 주석 방식을 검토하였다. 다양한 관계 주석 표지 중에서 특히 case와 aux에 집중하여 논의한 것은 한국어와의 주석 표지 적용 양상을 비교했을 때 분포 상 가장 두드러지는 차이를 나타내기 때문이다. case는 한국어와 일본어 모두 조사와 관련이 있고, aux는 한국어에서는 보조용언, 일본어에서는 조동사와 관련이 있는 표지이다. 구체적인 주석 양상을 살펴본 결과 일본어의 aux는 서법 조동사뿐만 아니라 동사에 문법적 의미를 더하는 요소, 한국어의 어미에 해당하는 형태에도 aux를 할당하기 때문에 주석이 차지하는 비율이 크게 차이가 나는 것으로 밝혀졌다. iobj(간접목적어 관계 표지)와 관련해서는 일본어에서 간접목적어를 인정하는 데에 반해 한국어에서는 간접목적어를 인정하지 않는 경우가 더 많았다. 일본어의 UD 주석에서 형태 분석 기본 단위인 '단단위'를 기본 구문 주석 단위로 하되 '장단위'와 문절 정보를 이용하는 것처럼, 한국어에서도 형태 분석 단위를 의존관계 주석의 정보로 활용하는 방안에 대해서 고려할 필요가 있다.

도시확장과 원도심 쇠퇴에 관한 공간구문론적 고찰: 제주시 동(洞) 지역을 중심으로 (A Space Syntactic Study on Urban Expansion and Decline of the Old City Center: Focusing on Jeju City)

  • 김성훈;오병삼;최내영
    • 토지주택연구
    • /
    • 제12권4호
    • /
    • pp.81-92
    • /
    • 2021
  • 본 연구는 도시확장이 원도심 쇠퇴의 원인으로 작용할 수 있을 것으로 가정하고, 그 가능성을 공간구문론(Space Syntax) 방법론으로 검토하고자 제주읍성 일대의 원도심을 대상으로 도시공간구조 분석을 수행하였다. 도시공간구조에 관한 종단적 분석의 시점은 일제강점기부터 현재 사이에 1914년, 1972년, 1982년, 1996년, 그리고 2021년 현재의 5개 시점으로 설정하였다. 도시공간구조 분석은 공간구문론의 ASA(Angular Segment Analysis)를 활용하였다. 분석결과, 제주시 동지역의 도시구조는 1914년에서 2021년 사이에 큰 변화를 겪어왔다. 도심은 단일핵 구조에서 다핵 구조로 변화하였으며, 원도심이 위치한 구제주 지역은 지리적으로 바다와 접하여, 도시확장이 한라산 자락의 남측으로 편중되어 도시중심부의 위치도 점차 남쪽으로 이동하였다. 이에 따라 제주시 원도심은 도시공간구조의 역동성에 의하여 도시중심부의 중심지에서 주변지역의 하나로 전락하였다. 이와 같이, 도시확장에 의한 도시공간구조 변화 과정에서 원도심의 도시중심부 이탈이 이루어졌다는 점에서, 원도심 쇠퇴의 한 요인으로서 도시확장의 가능성을 확인할 수 있었다.

국내 국.공립 박물관 기획전시공간의 변화가 전체공간구조에 미치는 영향에 관한 연구 - 뮤지엄내 위상 중심공간과 기획전시실공간의 관계를 중심으로 - (A Study on the Effect of the Changes in Temporary Exhibition Spaces of Korea's National and Public Museums on the Overall Space Structure of Museum - With Reference to Syntactic Relationship between the Most Integrated Space and Exhibition Space -)

  • 강현지;문정묵
    • 한국실내디자인학회논문집
    • /
    • 제21권1호
    • /
    • pp.203-210
    • /
    • 2012
  • Since a private museums started in Europe 17C, many private museums established for high-class people like aristocrats to collect and to keep art works and to appreciate for limited members. After the French Revolution in 18C, the publicity became an important social issue through all European regions, and the museum gradually changed into public ones. Like that, as the concept of museum changed, its social role as well as its function was also changed. The concept of collection and display or preservation changed into the concept of exhibition and appreciation featuring the publicity. With the year-round exhibition, a classical concept, the planned-exhibition, a new active concept set as an important factor for a museum's projects. The latter concept embraces new social issues. Therefore as the space for planned-exhibitions reflecting social issues every season was needed, a museum sets its planned-exhibition space with the changeability, and gradually expands this kind of space in size. It is expected that planned-exhibition spaces characterized as the changeability may give some changes on the flow of a museum's overall space, and may have substantial influences on the flow. To recognize the changes in a planned-exhibition space's influence on the museum, this study selected some national, public museums having the planned-exhibition space, and investigated their influences on each museum's overall space structure through the analysis on space syntax. This study assumed the change of planned-exhibition space as the changes in the number of convex spaces, and measured it. And to understand the planned-exhibition's changes on a museum's overall spaces, such changed assumed as the numeric changes in convex spaces and measured them. In addition, the numeric changes's influence on the overall space structure was analyzed by measuring the overall space's average integration level. Through the above two factors, the 3 research methodologies and analyzed results were drawn out.

  • PDF

양(quantity), 정도(degree), 가능세계 - 부사 '거의'의 어휘의미를 중심으로 - (Quantities, Degrees, and Possible Worlds - Lexical Semantics of Korean Adverb '거의(geoui)')

  • 김신회
    • 한국언어정보학회지:언어와정보
    • /
    • 제15권2호
    • /
    • pp.47-65
    • /
    • 2011
  • A Korean adverb '거의(geoui)' modifies predicates to generate complex predicates which have meanings of 'nearly' complete or typical properties of the modified predicates in quantities, degrees, and frequencies. The modified predicates 'complete' or 'typical' properties are referred counterfactually as standards for the generated predicates' meanings of deficiencies. These counterfactual standards can be formalized by a counterfactual conditional operator of the intensional semantics in Cresswell(1990). The deficiencies in the quantities, degrees, or frequencies of the properties can be expressed formally introducing a world-independent measure of comparison. The measure can be manufactured out of relations between intensional things at indices and their equivalence classes. The world-independent measure of comparison has a semantic structure under-specified in quantity, degree, and frequency, and seems very well-suited in describing lexical meaning of '거의(geoui)'. The lexical-semantic analysis of '거의(geoui)' shows explicitly the plausibility of the indispensable existence of the comparing measure which works across real and counterfactual worlds in natural language meaning. On the other hand, we examined Kim, young-hee(1985)'s proposal of a transition of quantificational meaning for Korean degree adverbs, where he tried to explain the quantificational meaning of Korean degree adverbs in general including '거의(geoui)' with several syntactic and semantic constraints of 'contextual deletion'. But it is shown that the quantificational meanings of the degree adverbs which Kim(1985) discussed are also explained better by their under-specified meanings in quantities, frequencies and degrees with the world-independent measure of comparison applied to their paradigmatic lexical constraint rather than Kim(1985)'s transition of meaning.

  • PDF

Chatting Pattern Based Game BOT Detection: Do They Talk Like Us?

  • Kang, Ah Reum;Kim, Huy Kang;Woo, Jiyoung
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제6권11호
    • /
    • pp.2866-2879
    • /
    • 2012
  • Among the various security threats in online games, the use of game bots is the most serious problem. Previous studies on game bot detection have proposed many methods to find out discriminable behaviors of bots from humans based on the fact that a bot's playing pattern is different from that of a human. In this paper, we look at the chatting data that reflects gamers' communication patterns and propose a communication pattern analysis framework for online game bot detection. In massive multi-user online role playing games (MMORPGs), game bots use chatting message in a different way from normal users. We derive four features; a network feature, a descriptive feature, a diversity feature and a text feature. To measure the diversity of communication patterns, we propose lightly summarized indices, which are computationally inexpensive and intuitive. For text features, we derive lexical, syntactic and semantic features from chatting contents using text mining techniques. To build the learning model for game bot detection, we test and compare three classification models: the random forest, logistic regression and lazy learning. We apply the proposed framework to AION operated by NCsoft, a leading online game company in Korea. As a result of our experiments, we found that the random forest outperforms the logistic regression and lazy learning. The model that employs the entire feature sets gives the highest performance with a precision value of 0.893 and a recall value of 0.965.

RDF(S) 모델에 기반한 다양한 형태의 단백질 데이타베이스 통합 (Integration of Heterogeneous Protein Databases Based on RDF(S) Models)

  • 이강표;유상원;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권2호
    • /
    • pp.132-142
    • /
    • 2008
  • 현재 생물학 분야에는 단백질이라는 동일한 대상에 대해 각기 고유한 의미를 지니고 있는 다양한 형태의 단백질 분석 데이타베이스들이 존재한다. 이렇게 산재되어 있는 이종의 단백질 정보들을 효과적으로 통합한다면 개개의 데이터베이스로부터는 얻을 수 없는 유용한 정보를 도출해낼 수 있다. 생물학 데이타의 특성상 이 각각의 정보들은 자신만의 고유한 형태와 의미를 지니는데, 시맨틱 웹 기술의 표준인 RDF(S) 모델을 이용하여 데이타를 기술하면 형태론적인 통합뿐만 아니라 의미론적인 통합까지 이루어낼 수 있다. 이에 본 논문에서는 RDF 통합 스키마에 기반한 새로운 통합 레이어(layer)를 제안하였다. 이를 위해 개념적 모델 차원으로서는 단백질 정보를 중심으로 통합 스키마를 구축하였고, 표현적 모델 차원으로 서는 래퍼(wrapper)가 해당 데이터베이스들로부터 필요한 정보를 취하여 동적으로 RDF 인스턴스를 구축하는 방법을 제안하였다. 실제로 이 통합 레이어는 연구자들이 필요로 하는 통합 질의 예제를 성공적으로 처리하여 그 결과를 보여줄 수 있음을 확인하였다.

정의형 질의응답 시스템을 위한 정답 패턴 (Answer Pattern for Definitional Question-Answering System)

  • 서영훈;신승은
    • 한국콘텐츠학회논문지
    • /
    • 제5권3호
    • /
    • pp.209-215
    • /
    • 2005
  • 본 논문에서는 정의형 질의응답 시스템을 위한 정답 패턴에 대하여 기술한다. 정의형 질의응답 시스템은 정의형 질의에 대한 정답으로 단답형 정답이 아닌 서술형 정답을 제공하기 때문에, 정답 추출 방법이 일반적인 단답형 정답 추출 방법과 다르다. 정의형 정답 패턴을 이용한 정의형 정답 추출은 의미 분석없이 정확한 정의형 정답을 추출할 수 있다. 정의형 정답 패턴은 정확한 정답 추출을 위해 정답 패턴과 패턴별 제약 규칙, 우선순위로 구성된다. 정의형 정답 학습 코퍼스로부터 정답 패턴을 추출하고, 각각의 정답 패턴에 대한F-measure에 따라 최적화하여 패턴별 제약 규칙을 구성한다. 마지막으로 정확률과 정답 패턴 구문 구조를 이용하여 우선순위를 결정한다. 제안한 정의형 정답 패턴을 이용한 정의형 정답 추출은 실험 코퍼스에 대해 정확률 0.8207, 재현율 0.9268, F-measure 0.8705를 보였다. 이것은 제안한 방법이 정의형 질의응답 시스템에 효율적으로 사용될 수 있음을 의미한다.

  • PDF

다양한 웹 데이터를 이용한 특정 유기체의 단백질 상호작용 데이터베이스 개발 (Development of an Organism-specific Protein Interaction Database with Supplementary Data from the Web Sources)

  • 황두성
    • 정보처리학회논문지D
    • /
    • 제9D권6호
    • /
    • pp.1091-1096
    • /
    • 2002
  • 이 논문은 단백질 상호작용 데이터베이스 개발에 관해 기술한다. 개발된 시스템의 특징으로서는 첫째, 생물학자들의 직접적인 실험을 통해 얻어진 단백질 상호작용 및 유전인자 데이터를 제공한다. 둘째, 생물학적으로 관련 있는 다양한 형식의 데이터를 wrapper를 통해 광범위하게 분포된 웹사이트들로부터 추출한다. 셋째, 다양한 웹 데이터들 간의 어휘적, 의미적 이질성을 완화하기 위해 wrapper-mediator에 의한 계층적 모듈 구조를 이용하여 추출된 데이터는 통합 과정을 거친 후, 데이터베이스 저장 및 검색을 가능하게 하였다. 현재까지, 주어진 약 11,500 단백질들에 대해, 생물적으로 의미 있는 데이터를 약 40% 정도 데이터베이스 화 했다. 본 개발된 시스템은 프로티오믹스 연구에서 데이터 분석에 유용할 것으로 기대된다.

The Spatial Performance of Multi-Level Shopping Clusters A Case Study of Nanshan Commercial Cultural District

  • Haofeng, Wang;Yupeng, Zhang;Xiaojun, Rao
    • 국제초고층학회논문집
    • /
    • 제6권2호
    • /
    • pp.149-163
    • /
    • 2017
  • With the intensification of urban development in Chinese cities, mixed land use in urban centers extends vertically into 3-D and expands its scale from a single building to commercial clusters. The multi-level pedestrian system in city centers also changed its role from one of traffic isolation to spatial integration, where transit nodes, street sidewalks, squares, building entrances, atriums, and corridors are interconnected, both horizontally and vertically, into a whole spatial system, within which pedestrian flows are guided and shopping facilities are arranged. This paper uses spatial configuration analysis of space syntax to examine the impacts of spatial patterns on movement distribution and the business performance of tenant mix in the multi-level commercial system of the Nanshan Commercial Cultural District in Shenzhen, China. The key objective is to better understand the interactions between the socio-economic variables and spatial design parameters of a shopping complex. The research findings point to the importance of multiplicity between syntactic variables and other spatial variables in influencing the pedestrian flows, business performance and tenant mix in highly complex commercial systems. Particularly noteworthy is the relationship between spatial accessibility measures and the location of escalators, and the ways in which individual commercial buildings are embedded into the overall spatial system. The study suggests that this may lead to the preliminary identification of the spatial qualities of effective vertical extensions of mixed land use in a high-density urban settings.

단어통사론을 위한 계산 모형 (A Computational Model for the Word-Syntax)

  • 김동주;김한우
    • 전자공학회논문지CI
    • /
    • 제39권6호
    • /
    • pp.11-23
    • /
    • 2002
  • 한국어 형태론에 대한 기존의 전산모형은 선형적인 것들로 단어 내부구조 분석보다 형태소 분리 문제에만 관심을 두고 있다. 이러한 선형적 전산모형을 구문 분석 과정과 통합적으로 고려할 경우, 구문 단위 요소의 형성을 위해 형태소 분석 결과를 묶어야만 하는 추가적인 과정이 필요할 뿐만 아니라 의미적 직관성을 얻기도 어려웠다. 본 논문에서는 형태소 분리와 구문 요소 형성뿐만 아니라 단어의 구조 분석까지도 통합적으로 다룰 수 있는 단어통사론적 시각에 따른 전산 모형을 제안한다. 먼저 형태소 분리와 변형 문제를 다루기 위해 2단계형태론의 형식화를 도입하고, 품사 문맥을 반영하기 위해 기능성 구분문자를 제안한다. 그리고 형태소의 통사적 결합 검사를 위해 GLR에 기반한 변형 알고리즘을 제안한다.