• 제목/요약/키워드: 문법적 규칙

검색결과 120건 처리시간 0.036초

워드문서 콘텐츠의 사용자 XML 콘텐츠로의 변환 및 저장 시스템 개발 (Rule Based Document Conversion and Information Extraction on the Word Document)

  • 주원균;양명석;김태현;이민호;최기석
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2006년도 추계 종합학술대회 논문집
    • /
    • pp.555-559
    • /
    • 2006
  • 본 논문은 HWP, DOC와 같은 워드 문서를 대상으로 사용자가 작성한 구조적인 규칙과 XML 기반 워드 문서 변환 기법을 이용함으로써, 사용자의 관심 영역에 해당하는 다양한 형태(표, 리스트 등)의 정보를 효과적으로 추출(변환)하여 저장하기 위한 방법에 관한 것이다. 본 논문에서 제시한 시스템은 3가지의 중요한 요소들로 구성되어 있는데, 1)워드문서의 원시 XML문서로의 변환방법, 2)XML 기반 구조적인 규칙 작성과 규칙을 이용하여 원시 XML 문서에서 정보를 추출(변환)하는 방법, 3)추출 된 정보에서 최종 XML을 생성하거나 DB에 저장하는 방법이 그것이다. 워드문서의 변환을 위해서 독립적으로 동작하는 OCX 기반의 워드문서 변환 데몬(daemon)을 개발하였고, 사용자의 정보 추출(변환)과정을 돕기 위해서 XSLT를 확장한 형태의 스크립트 언어를 개발하였다. 스크립트 언어는 비교적 간단한 문법 구조를 가지고 있고, 데이터 처리를 위한 자체 정의 함수와 변수를 사용한다. 추출된 정보는 원하는 형태의 구조적인 문서로 생성하거나 DB에 저장할 수 있다. 개발한 시스템(PPE)은 워드 문서 원문 정보에 대한 데이터베이스 구축 및 서비스의 제공, 혹은 구축된 데이터베이스를 이용하여 다양한 처리를 하거나 현황 통계를 제공하는 분야에서 유용하게 사용할 수 있다. 실제로 연구과제관리 시스템과 성과정보시스템에 시범 적용하였다.

  • PDF

에서로/KE:한영 기계 번역 시스템 (FromTo/KE: A Korean-English Machine Translation)

  • 여상화;김영길;최승권;김태완;박동인;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.283-287
    • /
    • 1997
  • 본 논문에서는 당 연구소 주관으로 연구개발정보센터(KORDIC), 서울대와 공동으로 개발중인 한영 기계번역 시스템, '에서로/KE'의 prototype system을 설명한다. 에서로/KE는 KORDIC에서 한국어 형태소 분석기와 Tagger를 개발하고, 서울대에서 한국어 구문해석기와 한영 변환기를 개발하고, SERI에서 영어 구문 생성기와 영어 형태소 생성기를 개발한다. 한국어 Tagger는 HMM에 기반하여 제작되었으며 sample 200문장에 대해 98.9%의 정확률을 보인다. 한국어 구문 해석기는 의존 문법에 기반하여 CYK 알고리즘을 사용하여 제작되었으며 중의성 해결을 위해 29개의 최적 parse 선택 규칙이 구현되어 있다. 한영 변환기는 collocation과 idiom에 기반하여 한영 변환을 수행한다. 영어 구문 생성기는 Tree 변환 언어인 GWL(Grammar Writing Language)를 사용하여 작성되었으며, 영어 형태소 생성기는 최종적으로 자연스러운 영어 표층문을 생성한다. 에서로/KE는 현재 1차년도 Prototype system이 Unix 환경에서 구현되어 있으며, 현재 각 모듈별 성능 개선과 대량 사전 구축을 통해 상용화될 예정이다.

  • PDF

RDF 스키마에서 UML 클래스 다이어그램으로의 변환 (An Conversion a RDF Schema into an UML Class Diagram)

  • 이미경;하얀;김용성
    • 한국정보처리학회논문지
    • /
    • 제7권1호
    • /
    • pp.29-40
    • /
    • 2000
  • 인터넷 상의 문서가 많아지고 이에 대한 정확한 접근이 요구됨에 따라, 인터넷 자원에 대한 메타데이터를 표준화시키고, 메타베이스를 구축, 활용하는 것은 매우 중요하다. RDF(Resource Description Framework)는 구조화된 메타데이터를 표현하고, 교환하며 재사용하기 위한 기반 구조이며, 문법으로 XML을 이용하기 때문에 표준화된 메타데이터에 대한 일괄된 표현 및 교환, 처리가 가능하다. RDF 스키마는 RDF 모델에서 사용을 위해 제안한 기본 타입 시스템으로 본 논문에서는 XML로 된 RDF 스키마를 UML 클래스 다이어그램에 사상시키는 규칙과 알고리즘을 제안하고 이를 통해 객체 모델링하므로써 객체 지향 데이터베이스 스키마로의 변환을 용이하게 한다. 그리고, RDF 스키마에 대한 객체지향 스키마 형태인 형식 모델을 정의하여 객체지향 문서 처리와 검색을 위한 효율적인 환경을 제시할 것이다.

  • PDF

확률적 문법규칙에 기반한 국어사전의 뜻풀이말 구문분석기 (A Parser of Definitions in Korean Dictionary based on Probabilistic Grammar Rules)

  • 이수광;옥철영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권5호
    • /
    • pp.448-448
    • /
    • 2001
  • The definitions in Korean dictionary not only describe meanings of title, but also include various semantic information such as hypernymy/hyponymy, meronymy/holonymy, polysemy, homonymy, synonymy, antonymy, and semantic features. This paper purposes to implement a parser as the basic tool to acquire automatically the semantic information from the definitions in Korean dictionary. For this purpose, first we constructed the part-of-speech tagged corpus and the tree tagged corpus from the definitions in Korean dictionary. And then we automatically extracted from the corpora the frequency of words which are ambiguous in part-of-speech tag and the grammar rules and their probability based on the statistical method. The parser is a kind of the probabilistic chart parser that uses the extracted data. The frequency of words which are ambiguous in part-of-speech tag and the grammar rules and their probability resolve the noun phrase's structural ambiguity during parsing. The parser uses a grammar factoring, Best-First search, and Viterbi search In order to reduce the number of nodes during parsing and to increase the performance. We experiment with grammar rule's probability, left-to-right parsing, and left-first search. By the experiments, when the parser uses grammar rule's probability and left-first search simultaneously, the result of parsing is most accurate and the recall is 51.74% and the precision is 87.47% on raw corpus.

초급 상 수준을 위한 스토리텔링 중심의 영어 말하기 교수 전략 (Strategies of Storytelling Based Teaching of English Speaking for Novice High Learners)

  • 고미숙
    • 한국산학기술학회논문지
    • /
    • 제16권5호
    • /
    • pp.3172-3179
    • /
    • 2015
  • 본 연구는 성인 영어 학습자의 말하기 숙련도 향상을 위한 영어교수법을 제안하고 있다. 패턴 위주의 문장암기나 문법 규칙 중심의 대화식 영어회화 교육 방법을 탈피하여 스토리텔링 기법을 적용한 영어 말하기 교수 방법론을 소개하고 있다. 스토리텔링 중심의 영어 말하기 교수법의 이론적 타당도를 세 가지 측면에서 살펴본다. 말하기의 목적 즉, 자신의 생각을 적절히 설득적으로 표현하고 자신의 의견을 나눌 수 있기 위해서는 먼저 풍부한 담화량의 확보가 관건이다. 이를 위하여 이야기 구성요소 중심의 말하기 전략 12가지를 소개하고, 말하기 학습에 적용해 보고 있다. 다음으로, 수사학적 차원에서 설득적인 말하기를 위한 전략을 살펴본다. 아리스토텔레스의 설득적인 말하기를 위한 수사학적 5대 영역을 중심으로 스토리텔링 기법의 말하기와의 관련성을 찾아본다. 끝으로, 교육 현장에서 스토리텔링 중심의 영어 교수법 적용의 가능성을 살펴본다. 외국어 학습자로서의 언어 숙련도가 모국어 수준과 다르다는 이유만으로 위와 같은 스토리텔링 기법의 영어 말하기 교수가 교육 현장에서 실현될 수 있을까에 관한 의문에 학습자 전략 사용 양상을 살펴봄으로써 이에 대한 실현 가능성을 긍정적으로 기대한다.

언어 장애인의 언어보조 시스템을 위한 아이콘 언어의 구현 (Implementation of Iconic Language for the Language Support System of the Language Disorders)

  • 추교남;우요섭;민홍기
    • 정보처리학회논문지B
    • /
    • 제13B권4호
    • /
    • pp.479-488
    • /
    • 2006
  • 언어 장애인에게 기존의 키보드에 의한 문자입력 방법보다 원활하고 편리한 의사전달 환경을 제공하기 위한 아이콘 언어 인터페이스를 설계한다. 이를 위하여 활용성이 높은 대화 영역으로부터 구축한 원시 말뭉치를 대상으로 어휘 구사 경향과 특성을 분석하고 형태소, 구문, 의미 분석을 적용하여 아이콘에 부여되는 한국어의 어휘와 의미를 추출한다. 사용자가 직관적으로 인지하고 전달할 수 있는 아이콘 영역을 선별하고 추출한 한국어의 어휘와 의미를 정합시킨다. 이웃하는 아이콘간의 연결로부터 전달하고자 하는 의미적 상황을 만들어내기 위하여, 아이콘 언어의 어휘와 품사, 문법 규칙, 의미체계를 정의하여 아이콘 언어를 설계한다. 아이콘 언어에서 나타날 수 있는 언어적 애매성을 해결하기 위한 방법으로 범용의 한국어 의미사전과 술어 중심의 하위범주화사전으로부터 아이콘 언어에 대한 상황중심의 의미 데이터를 구축한다. 이를 바탕으로 아이콘 언어 인터페이스로부터 한국어를 의미적인 범주에서 생성한다.

모바일 서비스관리를 위한 정책정의언어 (Policy Definition Language for Service Management in Mobile Environment)

  • 안성욱;류성열
    • 정보처리학회논문지D
    • /
    • 제16D권4호
    • /
    • pp.561-570
    • /
    • 2009
  • 모바일 환경에서 유지보수의 효율적인 관리를 위해서는 서비스를 정책으로 관리하기 위한 시스템 구조와 정책정의언어가 필요하다. 본 연구는 IETF의 정책 프레임웍 중에 정책 실행자인 PEP 구조를 정의하고, PEP 구조하에서 수행될 수 있는 정책정의언어를 제안한다. 제안한 정책정의언어는 문헌자료와 모바일 특성을 기반으로 하여 요구사항을 도출하고, 3단계 접근 방법으로 정책정보모델을 설계하여 정책정의언어로 정의하였다. 3단계 접근 방법은 정책이 적용될 범위를 결정하는 정책도메인, 정책 적용 및 제어하는 종류를 구분하는 정책규칙, 정책 구조를 문맥화하는 정책문법으로 구성된다. 제안한 정책정의언어의 효율성을 검증하기 위하여 시나리오를 정책정의언어로 정의하여 정책 도구를 이용하여 검증하였고, 타 정책정의언어들과 비교 분석하여 확장성을 입증하였다.

조지 린드벡의 문화-언어의 종교이론 비평 (A Critical Evaluation of George Lindbeck's Cultural-Linguistic Theory of Religion)

  • 제해종
    • 한국콘텐츠학회논문지
    • /
    • 제14권4호
    • /
    • pp.456-466
    • /
    • 2014
  • 본 연구는 종교를 문화-언어로 이해한 린드벡의 후기자유주의에 관한 것이다. 전통적인 기독교 신학의 인식-명제적 접근과 자유주의의 경험-표현주의적 접근이 포스트모던적 종교 현상에 대한 해결책이 되지 못함을 인식한 조지 린드벡은 기존의 두 접근법들을 극복할 대안으로서 문화-언어적 접근법을 제시한다. 린드벡의 후기자유주의가 가진 첫 번째 통찰은 종교를 문화나 언어로 이해한다는 것인데, 이는 인간이 언어를 배우듯 종교에도 익숙해진다는 이유에서다. 두 번째 통찰은 첫 번째 것에서 파생된 것으로서 교리를 문법으로 이해하는 것이다. 만약 종교와 교리를 이런 식으로 이해한다면 종교 간의 갈등과 충돌의 문제는 자연스럽게 해결될 것인데, 이는 각각의 종교가 마치 언어에 좋고 나쁨이나 옳고 그름이 없는 것처럼 나름대로의 체계 안에서 해석될 수 있기 때문이다. 이 접근법이 종교 상호간에 화해를 가능케 하고, 실행성을 강조하고, 또 성경을 귄위 있는 신학적 텍스트로 삼았다는 점은 중요한 기여로 꼽을 수 있다. 하지만 이것은 텍스트 자체보다는 교회의 해석에 더 큰 비중을 두었고, 진리를 내적 일관성으로 격하시켰고, 모든 종교를 동일한 가치로 보는 극단적 상대주의와 언어가 종교생활에 필수적이라는 엘리트주의를 조장했을 뿐 아니라 신학적 종말론을 주장함으로써 명제주의로 회귀했다는 문제점을 안고 있다. 그러므로 연구자는 린드벡의 문화-언어의 종교이론을 신학적 보수주의와 자유주의의 한계를 극복할 대안으로는 부족하다고 결론 내린다.

에이전트 기반 지능형 게임 캐릭터 구현에 관한 연구 (On the Development of Agent-Based Online Game Characters)

  • 이재호;박인준
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 추계정기학술대회
    • /
    • pp.379-384
    • /
    • 2002
  • 개발적인 측면에서 온라인 게임 환경에서의 NPC(Non Playable Character)들은 환경인식능력, 이동능력, 특수 능력 및 아이템의 소유 배분 등을 원활히 하기 위한 능력들을 소유해야 하며, 게임 환경을 인식, 저장하기 위한 데이터구조와 자신만의 독특한 임무(mission)를 달성하기 위한 계획을 갖고 행위를 해야 한다. 이런 의미에서 NPC는 자신만의 고유한 규칙과 행동 패턴, 그리고 목표(Goal)와 이를 실행하기 위한 계획(plan)을 소유하는 에이전트로 인식되어야 할 것이다. 그러나, 기존 게임의 NPC 제어 구조나 구현 방법은 이러한 요구조건에 부합되지 못한 부분이 많았다. C/C++ 같은 컴퓨터 언어들을 이용한 구현은 NPC의 유연성이나, 행위에 많은 문제점이 있었다. 이들 언어의 switch 문법은 NPC의 몇몇 특정 상태를 묘사하고, 그에 대한 행위를 지정하는 방법으로 사용되었으나, 게임 환경이 복잡해지면서, 더욱더 방대한 코드를 만들어야 했고, 해석하는데 많은 어려움을 주었으며, 동일한 NPC에 다른 행동패턴을 적용시키기도 어려웠다. 또한, 대부분의 제어권을 게임 서버 폭에서 도맡아 함으로써, 서버측에 많은 과부하 요인이 되기도 하였다. 이러한 어려움을 제거하기 위해서 게임 스크립트를 사용하기도 하였지만, 그 또한 단순 반복적인 패턴에 사용되거나, 캐릭터의 속성적인 측면만을 기술 할 수 있을 뿐이었다 이러한 어려움을 해소하기 위해서는 NPC들의 작업에 필요한 지식의 계층적 분화를 해야 하고, 현재 상황과 목표 변화에 적합한 반응을 표현할 수 있는 스크립트의 개발이 필수 적이라 할 수 있다 또한 스크립트의 실행도 게임 서버 측이 아닌 클라이언트 측에서 수행됨으로써, 서버에 걸리는 많은 부하를 줄일 수 있어야 할 것이다. 본 논문에서는, 대표적인 반응형 에이전트 시스템인 UMPRS/JAM을 이용하여, 에이전트 기반의 게임 캐릭터 구현 방법론에 대해 알아본다.퓨터 부품조립을 사용해서 Template-based reasoning 예를 보인다 본 방법론은 검색노력을 줄이고, 검색에 있어 Feasibility와 Admissibility를 보장한다.매김할 수 있는 중요한 계기가 될 것이다.재무/비재무적 지표를 고려한 인공신경망기법의 예측적중률이 높은 것으로 나타났다. 즉, 로지스틱회귀 분석의 재무적 지표모형은 훈련, 시험용이 84.45%, 85.10%인 반면, 재무/비재무적 지표모형은 84.45%, 85.08%로서 거의 동일한 예측적중률을 가졌으나 인공신경망기법 분석에서는 재무적 지표모형이 92.23%, 85.10%인 반면, 재무/비재무적 지표모형에서는 91.12%, 88.06%로서 향상된 예측적중률을 나타내었다.ting LMS according to increasing the step-size parameter $\mu$ in the experimentally computed. learning curve. Also we find that convergence speed of proposed algorithm is increased by (B+1) time proportional to B which B is the number of recycled data buffer without complexity of computation. Adaptive transversal filter with proposed data recycling buffer algorithm could efficiently reject ISI of channel and increase speed of convergence in avoidance burden of computational complexity in reality when it was experimented having

  • PDF

불어의 "묵음 e (e muet)"에 관한 연구 (Some notes on the French "e muet")

  • 이정원
    • 대한음성학회지:말소리
    • /
    • 제31_32호
    • /
    • pp.173-193
    • /
    • 1996
  • 불어의 "묵음 e(e muet)"에 대한 정의를 내리기는 매우 까다롭다. 불어에서 "e"가 "묵음 e(e muet)"로 불리우는 이유는 "e"가 흔히 탈락되기 때문이다. 현재 "e muet"는 다음 발화체에서 볼 수 있듯이 열린음절에서만 나타난다. "Je/le/re/de/man/de/ce/re/por/ta/ge/." [omitted](나는 그 리포트를 다시 요구한다. : 이 경우 실제 발화시 schwa 삭제 규칙이 적용된다.) 둘째, 접두사에 나타나는 "e muet"는 s의 중자음 앞에서 s가 유성음, [z]로 발음되는 것을 막기 위해 쓰인다. "ressembler[omitted](닮다); ressentir[omitted](느끼다)" 같은 경우, 셋째, 몇몇 낱말의 경우 고어의 철자가 약화되어 "e muet"로 발음이 되고 있다. "monsieur[$m{\partial}sj{\emptyset}$](미스터), faisan[$f{\partial}z{\tilde{a}}$](꿩), faisait[$f{\partial}z{\varepsilon}$]("하다"동사의 3인칭 단수 반과거형)"등. 또 과거 문법학자들은 이를 "여성형의 E"로 불렀는데, 이는 형태론적으로 낱말의 여성형을 남성형과 구분짓기 위해 사용되고 있기 때문이기도 하다. 예를 들어, "$aim{\acute{e}}-aim{\acute{e}}e$"(발음은 둘 다 [${\varepsilon}me$]로 동일하다 : 사랑받다)의 경우. 현대불어의 구어체어서 "e muet"는 어말자음을 발음하기 위해 쓰이고 있다. 예를 들어, "pote[pot](단짝)-pot[po](항아리)". 이러한 "e muet"는 발음상으로 지역적, 개인적 및 문맥적 상황에 따라 그 음색 자체가 매우 불안정하며 여러 가지 음가(열린 ${\ae}$ 또는 닫힌 ${\O}$)로 나타난다. 예를 들어 "seul[$s{\ae}l$](홀로), ceux[$s{\O}$](이것들)"에서와 같이 발음되며, 또한 원칙적으로 schwa, [${\partial}$]로 발음이 되는 "Je[$\Im\partial$]"와 "le[$l{\partial}$]"의 경우, Paris 지역에서는 "Je sais[${\Im}{\ae}{\;}s{\Im}$](나는 안다); Prends-le[$pr{\tilde{a}}{\;}l{\ae}$](그것을 집어라)"로 발음을 하는 한편, 프랑스 북부 지방세서는 동일한 발화체를 [${\ae}$]대신에 [${\o}$]로 발음한다. 실제로 언어학적 측면에서 고려되는 "e muet"는 schwa로 나타나는 "Je[$\Im\partial$]"와 "le[$l{\partial}$]"의 경우인데, 불어 음운론에서는 schwa에 의해 대립되는 낱말짝이 없기 때문에 schwa를 음소로 인정할 것인가에 대해 논란이 있다. 그러나 불어에서 schwark 음운론적 역할을 한다는 사실은 다음과 같은 예에서 찾아 볼 수 있다. 첫째, 발음상으로 동사의 변화형에서 "porte[$p{\jmath}rte$](들다: 현재형), porte[$p{\jmath}rte$](과거분사형), porta[$p{\jmath}rte$](단순과거형)"등이 대립되며, 이휘 "Porto[$p{\jmath}rte$](포르토)"와도 대립된다. 둘째, 어휘적 대립 "le haut[$l{\partial}o$](위)/l'eau[lo](물)"와 형태론적 대립 "le[$l{\partial}$](정관사, 남성단수)/les[le](정관사, 복수)"등에서 "묵음 e"는 분명히 음운론적 역할을 하고 있다. 본 논문에서는 이와 같이 음색이 복잡하게 나타나는 "e muet"의 문제를 리듬단위, 문맥적 분포 및 음절모형 측면, 즉 음성학 및 음운론적 측면에서 다양하게 분석하여 그 본질을 규명해 보고 "e muet"탈락현상을 TCG(Theorie de Charme et de Gouvernement) 측면에서 새롭게 해석해 보았다.

  • PDF