• 제목/요약/키워드: syntax tree

검색결과 60건 처리시간 0.025초

효율적인 한국어 파싱을 위한 최장일치 기반의 형태소 분석기 기능 확장 (Functional Expansion of Morphological Analyzer Based on Longest Phrase Matching For Efficient Korean Parsing)

  • 이현영;이종석;강병도;양승원
    • 디지털콘텐츠학회 논문지
    • /
    • 제17권3호
    • /
    • pp.203-210
    • /
    • 2016
  • 한국어는 문장 구성소의 생략과 수식 범위가 자유롭기 때문에 파싱보다는 형태소 분석 단계에서 처리하면 좋은 경우가 있다. 본 논문에서는 파싱의 부담을 덜어 줄 수 있는 형태소 분석기의 기능 확장 방안을 제안한다. 이 방법은 미지어의 추정, 복합 명사 및 복합동사의 처리, 숫자 및 심볼의 처리에 의해 여러 형태소 열이 하나의 구문 범주를 가질 때 이것을 최장일치 방법으로 결합하고 의미 자질을 부여하여 하나의 구문 단위로 처리하는 것이다. 제안한 형태소 분석 방법은 불필요한 형태론적 모호성이 제거되고 형태소 분석 결과가 줄어들어 태거 및 파서의 정확률이 향상되었다. 또한, 실험을 통해 파싱트리는 평균 73.4%, 파싱 시간은 평균 52.9%로 줄었음을 보인다.

실패 전이를 갖는 트리를 이용한 스트리밍 XML 하드웨어 파서 (A Streaming XML Hardware Parser using a Tree with Failure Transition)

  • 이규희;한상수
    • 한국정보통신학회논문지
    • /
    • 제17권10호
    • /
    • pp.2323-2329
    • /
    • 2013
  • 웹서비스들은 데이터를 표현하기 위해 XML을 채택하고 있으며, 데이터의 사용을 위해 XML 파서가 필요하다. XML 파서에서 DOM(Document Object Model)은 가장 널리 사용되는 방법이지만, 트리를 생성하는 전처리 작업과 추가 메모리 공간이 요구되기 때문에 제한적 자원을 갖는 시스템들에는 적합하지 않다. 본 논문에서는 시스템의 성능 향상을 위해 전처리가 요구되지 않는 실패 전이를 갖는 스트리밍 XML 트리(StreXTree: Streaming XML Tree) 파서를 제안한다. 이전의 다른 연구들과 비교하여, 제안된 StreXTree 파서는 Search 파서 보다 약 2.39배, RBStreX 파서 보다 약 3.02배 성능이 향상되었다. 게다가, 제안된 StreXTree 파서는 XML의 구조와 문법을 검증하기 위한 Well-Formed 검사를 지원한다.

DTV 콘텐츠 검증 시스템을 위한 Java 컴파일러의 개발 (Development of a Java Compiler for Verification System of DTV Contents)

  • 손민성;박진기;이양선
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.1487-1490
    • /
    • 2007
  • 디지털 위성방송의 시작과 더불어 본격적인 데이터 방송의 시대가 열렸다. 데이터방송이 시작 되면서 데이터방송용 양방향 콘텐츠에 대한 수요가 급속하게 증가하고 있다. 하지만 양방향 콘텐츠 개발에 필요한 저작 도구 및 검증 시스템은 아주 초보적인 수준에 머물러 있는 것이 현실이다. 그러나 방송의 특성상 콘텐츠 상에서의 오류는 방송 사고에까지 이를 수 있는 심각한 상황이 연출 될 수 있다. 본 연구 팀은 이러한 DTV 콘텐츠 개발 요구에 부응하여, 개발자의 콘텐츠 개발 및 사업자 또는 기관에서의 콘텐츠 검증이 원활이 이루어 질수 있도록 하는 양방향 콘텐츠 검증 시스템을 개발 중이다. 양방향 콘텐츠 검증 시스템은 Java 컴파일러, 디버거, 미들웨어, 가상머신, 그리고 IDE 등으로 구성된다. 본 논문에서 제시한 자바 컴파일러는 양방향 콘텐츠 검증 시스템에서 데이터 방송용 자바 애플리케이션(Xlet)을 컴파일하여 에뮬레이팅 하거나 런타임 상에서 디버깅이 가능하도록 하는 바이너리형태의 class 파일을 생성한다. 이를 위해 Java 컴파일러는 *.java 파일을 입력으로 받아 어휘 분석과 구문 분석 과정을 거친 후 SDT(syntax-directed translation)에 의해 AST(Abstract Syntax Tree)를 생성한다. 클래스링커는 생성된 AST를 탐색하여 동적으로 로딩 되는 파일들을 연결하여 AST를 확장한다. 의미 분석과정에서는 확장된 AST를 입력으로 받아 참조된 명칭의 사용이 타당한지 등을 검사하고 코드 생성이 용이하도록 AST를 변형하고 부가적인 정보를 삽입하여 ST(Semantic Tree)를 생성한다. 코드 생성 단계에서는 ST를 입력으로 받아 이미 정해 놓은 패턴에 맞추어 Bytecode를 출력한다.ovoids에서도 각각의 점들에 대한 선량을 측정하였다. SAS와 SSAS의 직장에 미치는 선량차이는 실제 임상에서의 관심 점들과 가장 가까운 25 mm(R2)와 30 mm(R3)거리에서 각각 8.0% 6.0%였고 SAS와 FWAS의 직장에 미치는 선량차이는 25 mm(R2) 와 30 mm(R3)거리에서 각각 25.0% 23.0%로 나타났다. SAS와 SSAS의 방광에 미치는 선량차이는 20 m(Bl)와 30 mm(B2)거리에서 각각 8.0% 3.0%였고 SAS와 FWAS의 방광에 미치는 선량차이는 20 mm(Bl)와 30 mm(B2)거리에서 각각 23.0%, 17.0%로 나타났다. SAS를 SSAS나 FWAS로 대체하였을 때 직장에 미치는 선량은 SSAS는 최대 8.0 %, FWAS는 최대 26.0 %까지 감소되고 방광에 미치는 선량은 SSAS는 최대 8.0 % FWAS는 최대 23.0%까지 감소됨을 알 수 있었고 FWAS가 SSAS 보다 차폐효과가 더 좋은 것으로 나타났으며 이 두 종류의 shielded applicator set는 부인암의 근접치료시 직장과 방광으로 가는 선량을 감소시켜 환자치료의 최적화를 이룰 수 있을 것으로 생각된다.)한 항균(抗菌) 효과(效果)를 나타내었다. 이상(以上)의 결과(結果)로 보아 선방활명음(仙方活命飮)의 항균(抗菌) 효능(效能)은 군약(君藥)인 대황(大黃)의 성분(成分) 중(中)의 하나인 stilbene 계열(系列)의 화합물(化合物)인 Rhapontigenin과 Rhaponticin의 작용(作用)에 의(依)한 것이며, 이는 한의학(韓醫學) 방제(方劑) 원리(原理)인 군신좌사(君臣佐使) 이론(理論)에서 군약(君藥)이 주증(主症)에 주(主)로 작용(作用)하는 약물(藥物)이라는 것을 밝혀주는 것이라고

울릉도 자생 큰연령초의 분포와 자생지의 생태적 특성 (Ecological Characteristics and Distribution of Native Trillium tschonoskii in Ulleung Island)

  • 안영희;이성제;이상현
    • 생약학회지
    • /
    • 제38권2호통권149호
    • /
    • pp.157-163
    • /
    • 2007
  • Trillium tschonoskii Maxim. is a kind of 64 endangered plant species designated by the Ministry of Environment in Korea. It is very a rare native plant throughout the country. Therefore, this study was conducted to investigate the native T. tschonoskii in Ulleung Island for their distribution and ecological characteristics. They were mostly distributed valley, mid-slope of the mountain from 186 to 458 m altitude. They had a little low light conditions as they faced west, north west, south west, south-south west, north-north east and east-east north. They were provided with slightly humid condition. Aerial humidities of these quadrates were variable as 21.5-71%. They were located on the variable slopes of 5 to 43 degrees. Soil humidity was slightly dry. Native sites were semi-shaded because tree layer such as Tilia insularis, Zelkova serrata, okamotoanum etc.and sub-tall tree layer such as Ligustrum foliosum, Comellia japonica, Tilia insularis, Callicarpa japonica and so on were grown near by. Woody plants such as A. Okamotoanum, Sorbus commixta, Fagus japonica var. multinervis etc. were frequently observed. These environmental conditions were suitable that T. tschonoskii grows up naturally because of high Percentage as 52.78% of blooming individuals in this study. These native sites were classified with three communities, T. tschonoskii-Majanthemum dilatatum community, T. tschonoskii-Anthriscus sylvestris community and T. tschonoskii-Hepatica maxima community in accordance with altitude and aerial humidity. The best way ffr the preservation of T. tschonoskii habitats and maintainance of its recent population is maintained in recent environmental condition and ecological condition without any management by human-being.

트리 구조를 이용한 수식 인식 연구 (A Study on Equation Recognition Using Tree Structure)

  • 박병준;김현식;김완태
    • 한국정보전자통신기술학회논문지
    • /
    • 제11권4호
    • /
    • pp.340-345
    • /
    • 2018
  • 수식은 일반 문장에 비해 복잡한 구조와 다양한 문자와 기호가 사용되어 단순한 키보드 입력만으로는 모든 문자 집합을 입력할 수 없어 한글이나 워드 같은 문서편집기 내에서도 자체적으로 구현된 수식 편집기를 사용하고 있다. 수식을 올바르게 표현하기 위해 구문을 해석할 수 있는 의미가 될 수 있는 사전 학습 정보가 필요하다. 문자가 입력되더라도 크기와 위치 서로간의 관계에 따라 다른 수식으로 표현될 수 있기 때문이다. 즉 표현될 위치와 크기 등 문자와 기호들 간의 상호관계를 고려하여 수식의 형태를 트리 모델로 표현한다. 문자인식 응용의 한 분야로 문자나 기호(부호)를 인식하는 기술을 이미 널리 알려졌지만, 수식을 입력과 해석하는 방법은 일반적인 텍스트에 비해 복잡한 분석 과정이 필요하다. 본 논문에서는 수식의 문자를 인식하고 표현되는 위치와 크기의 결정을 빠르게 해석하는 수식 인식기를 구현하였다.

자바 프로그램을 위한 효율적인 디버깅 방법 (A Efficient Debugging Method for Java Programs)

  • 고훈준;유원희
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2002년도 춘계학술대회 논문집
    • /
    • pp.170-176
    • /
    • 2002
  • 자바 언어는 다양한 플랫폼과 다양한 분야에서 사용되고 있는 대표적인 객체지향 언어이다. 자바 언어는 객체지향의 특징 때문에 전통적인 절차지향 언어 보다 프로그램의 구조가 단순하다. 그러나 복잡한 자바 프로그램을 디버깅하는 일은 쉽지 않다. 디버깅은 항상 소프트웨어 발전의 많은 비용이 드는 부분이다. 자바 프로그램의 구문 오류는 현재 디버깅 시스템에 의해서 쉽게 발견된다. 그러나 자바 프로그램에 포함된 논리적인 오류는 발견하기가 어렵다. 자바 프로그램을 위한 기존의 디버깅 기술은 절차지향언어에서 사용하는 순차적인 방법을 사용하고 있다. 불행히도, 이 전통적인 방법들은 종종 특별한 프로그램의 오류를 찾는데 적당하지 않다. 이는 프로그램의 크기가 커지고 복잡해짐에 따라 디버깅하는데 걸리는 시간이 프로그램을 개발하는 시간의 많은 부분을 차지하게 된다. 디버거 사용자가 자바 프로그램 내에 포함되어 있는 오류를 쉽게 찾아내는 일은 효율적인 소프트웨어 개발에서 매우 중요하다. 본 논문에서는 사용자가 자바프로그램을 좀 더 빠르게 디버깅을 할 수 있도록 알고리즈믹 디버깅 방법을 적용한다. 알고리즈믹 디버깅 방법은 함수의 호출관계를 실행 트리로 구성하고 이를 검사하여 에러가 포함 되어 있는 함수를 발견하는 방법이다. 따라서 기존의 순차적인 방법보다 디버깅하는 횟수를 줄일 수 있다.

  • PDF

미국의료시설 병동부의 시대적 변천과 공간적 특성에 관한 연구 (A Chronological Study on the Transformation and the Spatial Characteristics of Inpatient Care Facilities in the United States)

  • 이수경;최윤경
    • 의료ㆍ복지 건축 : 한국의료복지건축학회 논문집
    • /
    • 제23권3호
    • /
    • pp.57-69
    • /
    • 2017
  • Purpose: This study aims to emphasize interrelation between healthcare policies, design standards and hospital architecture of the United States since 1950s; to examine spatial characteristics of inpatient care facilities through case studies; and to consider the social implication of these spatial changes. Methods: In this study, reviewing the overall healthcare system, design standards and inpatient care facilities of the United States since 1950s, a total of five inpatient care facilities, one for each period, were selected in order to analyze the spatial characteristics. The spatial maps of Space Syntax were employed for analyzing five case studies. Results: The distance between the nursing station, the support service, and inpatient room were getting closer. The spatial structure of inpatient care facilities is transformed from tree structures to annular tree structures. This result shows that the efficiency between patient, staff and support service is higher and the depth of the spaces is getting deeper, which indicates that efficiency for improving healthcare quality affect the spatial structure of inpatient care facilities. Implications: In the future, if Korea's health policy is changed to a demand-oriented health care policy, this conclusion predicts medical planning of hospital will be focused on the efficiency.

무선 인터넷 서비스를 위한 HTML Filter의 설계 및 개발 (A Design and Implementation of HTML Filter for Wireless Internet Service)

  • 정삼진
    • 한국산학기술학회논문지
    • /
    • 제9권6호
    • /
    • pp.1659-1665
    • /
    • 2008
  • 본 논문에서는 무선 인터넷 서비스를 보다 원활하게 제공하기 위해서 HTML Filter의 설계 및 개발을 제안한다. HTML Filter는 HTML로 작성된 웹 문서를 WAP 환경에 맞는 휴대용 무선 장비에 적합한 WML 문서로 자동으로 변환한다. HTML Filter는 HTML 프로그램을 토큰 단위로 구분하는 "HTML 어휘 분석기", 어휘 분석 단계에서 만들어진 토큰들을 받아 들여서 프로그램의 문법적 구조를 분석하는 "HTML 구문 분석기", HTML 프로그램의 의미를 보다 효율적으로 표현할 수 있는 중간언어인 "HTML 추상구문트리", 그리고 중간언어인 추상구문트리를 WML 프로그램으로 변환하는 "목적 코드 WML 생성기"로 구성되어 있다. 기존의 컴파일러 개발 기술을 이용하여 제안된 번역 방식은 기존의 방식보다 개발하기 쉽고 효율적이어서 다른 무선 언어 변환 방식에도 응용할 수 있을 것으로 본다.

Ideograph를 이용한 최적화 및 병렬성 정보 표현에 관한 연구 (A Study on the Optimization and Parallelism Information Representation using Ideograph)

  • 정성옥;고광만
    • 지능정보연구
    • /
    • 제6권2호
    • /
    • pp.41-47
    • /
    • 2000
  • 최적화란 비효율적인 코드를 구분해 내서 실행 속도 및 기억 공간의 효율성을 높여 주는 방법으로 컴파일러의 각 단계에서 수행된다. Augustus K. Uht에 의해 제안된 Ideograph는 입력 프로그램에 대한 제어 의존성과 자료 의존성에 관한 정보를 동시에 표현할 수 있어 코드 최적화 단계에서 효과 적으로 이용될 수 있으며 프로그램에 존재하는 병렬성을 표현하는데 효과적이다. 구문 트리는 원시 프로그램을 정보를 효율적으로 표현할 수 있는 중간 표현으로서 컴파일러 구 현에 널리 사용되고 있다. 본 논문에서는 원시 프로그램의 중간 표현이 구문 트리를 입력으로 받아 최적화 정보를 추출한 후 제어 흐름 및 자료 흐름 분석 정보를 추출하여 제어 의존성과 자료 의 존성을 Ideograph에 동시에 표현한다.

  • PDF

웹기반 정보검색을 위한 자연어 키워드 색인에 관한 연구 (A Study on Natural Language Keyword Indexing for Web-based Information Retrieval)

  • 윤성희
    • 한국컴퓨터산업학회논문지
    • /
    • 제4권12호
    • /
    • pp.1103-1111
    • /
    • 2003
  • 정보검색의 방법으로 단일 주제어를 키워드로 색인하여 검색하는 방식이 널리 사용되어 왔으나 문서의 내용을 정확히 표현하기 어렵고 검색 결과의 문서 집합 또한 너무 커서 사용자의 만족도가 낮다. 본 논문에서는 자연언어 처리 기술인 구문 분석 모듈을 도입해 단어 이상의 단위인 구 단위를 색인과 검색의 단위로 삼는 구 단위 색인 및 검색 기법을 사용을 제안한다. 웹 문서들 자체가 갖는 다양한 오류들로 인해 현실적으로 충분히 만족할 만할 우수한 성능의 구문 분석 모듈이 구현되기는 어려우므로 상향식 구문 분석 모듈을 구현하여 완전한 구문 분석 결과를 얻지 못하는 많은 문장에 대해서도 구 단위 색인이 가능하며 단일어 색인보다 식별력이 뛰어나 검색 성능이 향상되고 검색 과정의 부하도 줄일수 있다.

  • PDF