통합 검색 | Korea Science

구조 정보를 이용한 웹 문서 범주화 모형 (A Categorization Model Based On Information Structure of HTML Documents)

조이영;최상희;정영미
- 한국정보관리학회:학술대회논문집
- /
- 한국정보관리학회 2000년도 제7회 학술대회 논문집
- /
- pp.147-152
- /
- 2000
본 연구는 다양한 웹 문서를 효과적으로 범주화 할 수 있는 모형을 구축하는데 그 목적이 있다. 이를 위해 본 연구에서는 웹 문서가 가지고 있는 구조 정보인 링크(link)와 문서 단계(level)를 활용하여 문서 유형을 식별한 후, 각 유형별로 범주화 과정을 달리 적용하여 범주화 성능을 개선시키는 방법을 고안하였다.
PDF

속성간의 대응이 범주학습에 미치는 효과 (The effects of attribute alignment on category learning)

이태연
- 인지과학
- /
- 제12권4호
- /
- pp.29-39
- /
- 2001
Kaplan(2000)은 유사성에서 동일하더라도 대응조건의 사례들이 더 정확하게 범주화된다는 결과를 보고하였다. 이 연구는 Kaplan(2000)의 결과가 연구에서 언어자극이 사용되었기 때문인지를 검토하고 대응효과가 속성에 대한 선택적 주의의 결과인지를 밝히고자 하였다[16]. 실험 1에서는 속성간의 대응이 유사성과 범주화에 모두 영향을 미치는지 그리고 대응되어 있는 속성들이 더 잘 기억되는지를 검토하였다. 그 결과에 따르면 공유속성의 수가 동일하더라도 속성이 대응되어 있으면 자극들이 더 유사하게 평정되었고 범주도 더 빠르고 정화하게 학습되었다. 이러한 결과는 속성간의 대응이 범주내 유사성을 높여 범주학습을 용이하게 하였기 때문이라고 해석될 수 있지만 속성회상검사에서 대응되어 있는 속성이 더 많이 회상된 결과를 볼 때 대응효과가 반드시 유사성에 의존한다고 보기 어렵다. 실험 2에서는 대응효과가 속성에 대한 선택적 주의의 결과인지를 살펴보기 위해 대응범주와 비 대응범주를 정의하는 속성의 수를 동일하게 통제하고 범주화에 적절한 속성에만 주의를 기울이도록 지시하였다. 그 결과를 보면 지시조건과 무관하게 비 대응조건보다 대응조건에서 범주가 더 빨리 학습되었지만 비 대응조건에서는 범주화에 적절한 속성에 주의를 기울이도록 지시한 조건에서 범주가 더 빨리 학습되었고 판단시간도 더 빨랐다. 결론적으로 범주화에서 대응은 범주화에 적절한 차원에 선택적 주의를 하는 과정을 촉진하는 것으로 보인다.
PDF

용어 가중치와 역범주 빈도에 의한 자동문서 범주화 (Automatic Text Categorization by Term Weighting and Inverted Category Frequency)

이경찬;강승식
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
- /
- pp.14-17
- /
- 2003
문서의 확률을 이용하여 자동으로 문서를 분류하는 문서 범주화 기법의 대표적인 방법이 나이브 베이지언 확률 모델이다. 이 방법의 기본 형식은 출현 용어의 확률 계산 방법이다. 하지만 실제 문서 범주화 과정에서 출현하지 않는 용어들도 성능에 많은 영향을 줄 수 있으며, 출현 용어들에 대한 빈도 이외의 역범주 빈도나 용어가중치를 적용하여 문서 범주화 시스템의 성능을 향상시킬 수 있다. 본 논문에서는 나이브 베이지언 확률 모델에 출현 용어와 출현하지 않는 용어들에 대한 smoothing 기법을 적용하여 실험하였다. 성능 평가를 위해 뉴스그룹 문서들을 이용하였으며, 역범주 빈도와 가중치를 적용했을 때 나이브 베이지언 확률 모델에 비해 약 7% 정도 성능 개선 효과가 있었다.
PDF

문헌범주화에서 학습문헌수 최적화에 관한 연구 (Optimization of Number of Training Documents in Text Categorization)

심경
- 정보관리학회지
- /
- 제23권4호
- /
- pp.277-294
- /
- 2006
본 연구는 실재 시스템 환경에서 문헌 분류를 위해 범주화 기법을 적용할 경우, 범주화 성능이 어느 정도이며, 적정한 문헌범주화 성능의 달성을 위하여 분류기 학습에 필요한 범주당 가장 이상적인 학습문헌집합의 규모는 무엇인가를 파악하기 위하여 kNN 분류기를 사용하여 실험하였다. 실험문헌집단으로15만 여건의 실제 서비스되는 데이터베이스에서 2,556건 이상의 문헌을 가진 8개 범주를 선정하였다. 이들을 대상으로 범주당 학습문헌수 20개(Tr-20)에서 2,000개(Tr-2000)까지 단계별로 증가시키며 8개 학습문헌집합 규모를 갖도록 하위문헌집단을 구성한 후, 학습문헌집합 규모에 따른 하위문헌집단 간 범주화 성능을 비교하였다. 8개 하위문헌집단의 거시평균 성능은 $F_1$ 값 30%로 선행연구에서 발견된 kNN 분류기의 일반적인 성능에 미치지 못하는 낮은 성능을 보였다. 실험을 수행한 8개 대상문헌집단 중 학습문헌수가 100개인 Tr-100 문헌집단이 $F_1$값 31%로 비용대 효과면에서 분류기 학습에 필요한 최적정의 실험문헌집합수로 판단되었다. 또한, 실험문헌집단에 부여된 주제범주 정확도를 수작업 재분류를 통하여 확인한 후, 이들의 범주별 범주화 성능과 관련성을 기반으로 위 결론의 신빙성을 높였다.
https://doi.org/10.3743/KOSIM.2006.23.4.277 인용 PDF

한국어 분석의 중의성 해소를 위한 하위범주화 사전 구축 (Development of Subcategorization Dictionary for the Disambiguation Korean Language Analysis)

이수선;박현재;우요섭
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
- /
- pp.257-264
- /
- 1999
자연언어 처리에 있어 문장의 성분 구조를 파악하는 통사적 해석에서는 애매성 있는 결과가 많이 생성된다. 한국어의 경우 어순 등의 통사적 특성뿐 아니라 상황과 의미, 문맥이 문장의 분석에 더 중요한 역할을 하기 때문에 문맥 자유 문법에 의한 접근 방법만으로는 중의적 구조의 해결이 어렵다. 이는 또한 의미 분석시 애매성을 증가시키는 원인이 된다. 이러한 통사적, 의미적 중의성 해결을 위해 용언 중심의 하위범주화 사전을 구축하였다. 본 논문에서는 용언에 따라 제한될 수 있는 하위범주 패턴을 정의하고 패턴에 따라 하위범주 사전을 구축하였다. 하위범주화 사전에는 명사의 시소러스와 정합하여 보어를 선택 제한(Selectional Restriction)할 수 있도록 용언과 명사와의 의미적 연어 관계에 따라 의미마커를 부여했다. 말뭉치를 통해 수집된 용언 12,000여개를 대상으로 25,000여개의 하위범주 패턴을 구축하였고 이렇게 구축한 하위범주화 사전이 120,000여 명사에 대한 의미를 갖고 있는 계층 시소러스 의미 사전과 연동하도록 하였다. 또한 논문에서 구현된 하위범주화 사전이 구문과 어휘의 중의성을 어느 정도 해소하는지 확인하기 위해 반자동적으로 의미 태깅(Sense Tagging)된 2만여 문장의 말뭉치를 통해 검증 작업을 수행하고, 의존관계와 어휘의 의미를 포함하고 있는 말뭉치에 하위범주 패턴이 어느정도 정합되는지를 분석하여, 하위범주 패턴과 말뭉치의 의존관계만 일치하는 경우와 어휘의 의미까지 일치하는 경우에 대해 평가한다. 이 과정에서 하위범주 패턴에 대한 빈도 정보나, 연어 정보를 수집하여 데이터베이스에 포함시키고, 각 의미역과 용언의 통계적 공기 정보 등을 추출하는 방법도 제시하고자 한다.을 입증하였다.적응에 문제점을 가지기도 하였다. 본 연구에서는 그 동안 계속되어 온 한글과 한잔의 사용에 관한 논쟁을 언어심리학적인 연구 방법을 통해 조사하였다. 즉, 글을 읽는 속도, 글의 의미를 얼마나 정확하게 이해했는지, 어느 것이 더 기억에 오래 남는지를 측정하여 어느 쪽의 입장이 옮은 지를 판단하는 것이다. 실험 결과는 문장을 읽는 시간에서는 한글 전용문인 경우에 월등히 빨랐다. 그러나. 내용에 대한 기억 검사에서는 국한 혼용 조건에서 더 우수하였다. 반면에, 이해력 검사에서는 천장 효과(Ceiling effect)로 두 조건간에 차이가 없었다. 따라서, 본 실험 결과에 따르면, 글의 읽기 속도가 중요한 문서에서는 한글 전용이 좋은 반면에 글의 내용 기억이 강조되는 경우에는 한자를 혼용하는 것이 더 효율적이다.이 높은 활성을 보였다. 7. 이상을 종합하여 볼 때 고구마 끝순에는 페놀화합물이 다량 함유되어 있어 높은 항산화 활성을 가지며, 아질산염소거능 및 ACE저해활성과 같은 생리적 효과도 높아 기능성 채소로 이용하기에 충분한 가치가 있다고 판단된다.등의 관련 질환의 예방, 치료용 의약품 개발과 기능성 식품에 효과적으로 이용될 수 있음을 시사한다.tall fescue 23%, Kentucky bluegrass 6%, perennial ryegrass 8%) 및 white clover 23%를 유지하였다. 이상의 결과를 종합할 때, 초종과 파종비율에 따른 혼파초지의 건물수량과 사료가치의 차이를 확인할 수 있었으며, 레드 클로버 + 혼파 초지가 건물수량과 사료가치를 높이는데 효과적이었다.\ell}$ 이었으며 , yeast extract 첨가(添加)하여 배양시(培養時)는 yeast extract
PDF

언어적 공간표상과 비언어적 공간표상에서의 범주화의 효과 (Effects of categorization on linguistic spatial representation and non-linguistic spatial representation)

서원식;한광희
- 한국인지과학회:학술대회논문집
- /
- 한국인지과학회 2002년도 춘계학술대회
- /
- pp.119-124
- /
- 2002
공간적 관계정보(spatial relation)가 언어적 표상시스템과 비언어적 표상시스템에서 어떻게달라지는가를 범주화 모델의 원형이론 모델을 적용하여 알아보고자 하였다. 이전의 연구들에 따르면 공간적 관계정보에 대한 프로토타입이 언어적 범주와 비언어적 범주에서 다르다는 연구 결과(Crawford 등 2000, Huttenlocher 등 1991)와 동일하다. (Hayward & Tarr 1995)는 상반된 연구 결과가 제기되고 있다. 하지만 이전 연구들에서의 문제점은 언어/비언어 표상체계 간의 편향을 통제하지 못했기 때문에 과제에 따라 서로 다른 결과가 나온 것이라고 볼 수 있다 본 연구에서는 두 대상간의 관계정보를 문장으로 제시한 조건, 그림으로 제시한 조건, 그리고 두 조건을 혼합한 조건을 사용하여 편향에 의한 효과를 제거하고자 하였다. 실험은 각 조건에 따라 짝으로 구성된 자극을 학습한 후 검사자극을 공간적 관계정보를 다양하게 하여 학습자극과 동일한지 아닌지를 판단하게 하였다. 실험결과 관계정보를 언어적으로 제시한 조건과 비언어적으로 제시한 조건간에 대상의 위치에 따른 반응시간의 경향성에서 차이가 없었으며, 대상이 단어인지 그림인지에 따라서 반응시간에서 통계적으로 차이가 나타났다. 그리고 두 표상체계에서 공간적 관계에 대한 프로토타입을 분석한 결과 수직축을 중심으로 전형성 효과가 나타나는 것을 알 수 있었다.
PDF

문단 단위 가중치 함수와 문단 타입을 이용한 문서 범주화 (Automatic Text Categorization Using Passage-based Weight Function and Passage Type)

주원균;김진숙;최기석
- 정보처리학회논문지B
- /
- 제12B권6호
- /
- pp.703-714
- /
- 2005
문서 범주화 분야에 대한 연구들은 전체 문서 단위에 한정되어 왔으나, 오늘날 대부분의 전문들이 주요 주제를을 표현하기 위해서 조직화 된 특정 구조로 기술되고 있어, 텍스트 범주화에 대한 새로운 인식이 필요하게 되었다. 이러한 구조는 부주제(Sub-topic)의 텍스트 블록이나 문단(Passage) 단위의 나열로서 표현되는데, 이러한 구조 문서에 대한 부주제 구조를 반영하기 위해서 문단 단위(Passage-based) 문서 범주화 모델을 제안한다. 제안한 모델에서는 문서를 문단들로 분리하여 각각의 문단에 범주(Category)를 할당하고, 각 문단의 범주를 전체 문서의 범주로 병합하는 방법을 사용한다. 전형적인 문서 범주화와 비교할 때, 두 가지 부가적인 절차가 필요한데, 문단 분리와 문단 병합이 그것이다. 로이터(Reuter)의 4가지 하위 집합과 수십에서 수백 KB에 이르는 전문 테스트 컬렉션(KISTl-Theses)을 이용하여 실험하였는데, 다양한 문단 타입들의 효과와 범주 병합 과정에서의 문단 위치의 중요성에 초점을 맞추었다 실험한 결과 산술적(Window) 문단이 모든 테스트 컬렉션에 대해서 가장 좋은 성능을 보였다. 또한 문단은 문서 안의 위치에 따라 주요 주제에 기여하는 바가 다른 것으로 나타났다.
https://doi.org/10.3745/KIPSTB.2005.12B.6.703 인용 PDF KSCI

일화 기억의 의미적 범주화가 세부 기억의 부호화에 미치는 영향에 대한 자기공명영상 분석 연구 (The effect of semantic categorization of episodic memory on encoding of subordinate details: An fMRI study)

이세중;한상훈
- 인지과학
- /
- 제28권4호
- /
- pp.193-221
- /
- 2017
의미적 연관성을 지닌 일화들의 범주화는 기억을 더 효과적으로 구조화하는데 도움이 된다. 그러나 해당 일화의 하위 세부 기억들에 대한 상기한 범주화의 영향은 아직 명확하게 알려져 있지 않다. 본 연구에서는 fMRI 실험을 통해 의미적 범주화가 이루어지는 동안 상위의 일화 기억에 주의를 기울이는 것이 하위 세부기억의 생성을 방해하는지, 혹은 강화하는지 실험하였다. 참가자들에게 한 사이클 내에서 각각 2개의 하위단어를 가지고 있는 5개의 목표 단어들이 순서대로 제시되었는데, 참가자들은 해당 사이클 내에서 제시된 목표 단어들을 포함할 수 있는 범주를 떠올릴 수 있는지 응답한 후 그 범주에 대한 주관적 확신도를 평정하였다. fMRI 내 과정이 끝난 후 참가자들은 스캐너 밖으로 이동하여 제시되었던 단서 단어의 하위 단어들에 대한 단서 회상과제를 수행하였다. 행동 실험 결과 매 사이클의 세 번째 시행에서 범주화 과제의 반응속도가 감소하였고 동시에 주관적 확신도 수준이 증가하였는데, 이는 해당 시행에서 의미적 범주화가 완성되었음을 의미한다. 주목할 점은 세 번째 시행 바로 직전에 제시되었던 하위 단어들의 회상 정확도가 그 다음 시행 직전에 제시된 단어들에 비해 유의미하게 낮았다는 점이며 이는 범주화가 완성될 때 일화 기억의 하위 세부 요소들이 손상되었음을 의미한다. 일반선형모델을 통한 분석 결과 의미적 범주화가 완성되기 직전의 시행에서 의미적 기억망과 관련이 있는 것으로 알려져 있는 측두회와 하전두회에서 유의미한 활성화가 나타났다. 또한 패턴 유사성 분석 결과 또한 측두회, 하전두회, 해마 영역에서 세 번째 시행 간의 활성화 패턴이 두 번째 시행의 활성화 패턴에 비해 더 일관적인 것으로 나타났다. 본 연구는 의미적 범주화가 하위 세부 일화 기억을 방해할 수 있다는 것을 보여주며, 이러한 범주화가 진행되는 동안 일어나는 의미적 인출 경험이 관련된 일화 기억의 흔적에 질적인 영향을 미칠 수 있음을 시사한다.
https://doi.org/10.19066/cogsci.2017.28.4.001 인용 PDF

다계층 퍼셉트론의 온라인 학습에서 학습 순서 제어의 효과 (Effect of Training Sequence Control in On-line Learning for Multilayer Perceptron)

이재영;김황수
- 한국정보과학회논문지:소프트웨어및응용
- /
- 제37권7호
- /
- pp.491-502
- /
- 2010
인간이 교육을 통해 지식을 습득하고 발전시키는 과정에서, 이전 단계에서의 학습 진행 과정은 향후 학습에 영향을 미친다. 이것은 기계 학습에서도 고려되어야 할 사항으로 실제 기계 학습에서 학습순서의 제어가 어떤 효과가 있는지 살펴볼 필요가 있다. 본 연구에서는 MLP의 학습에서 지도자가 목표값을 알려주는 역할은 물론, 학습 대상의 지식 정도를 고려하여 자료들의 학습 순서를 제어하는 추가적 역할도 수행할 때, 학습 과정에 미치는 효과를 실험한다. 실험 방법은 SOM과 MLP를 이용하여 분류 문제에 적용한다. SOM은 지도자가 학습 순서를 결정하기 위한 학습 자료들의 범주화에 이용되고, MLP는 학습 대상이 된다. 제안하는 방법은 SOM을 학습 자료의 전처리 방법이 아닌, 학습 과정 동안 학습 자료의 선택에 이용하는 점에서 여타 연구들과 차이가 있으며, 실험 결과는 학습에 사용되는 자료의 수와 학습 횟수에서 개선 효과가 있음을 보여준다.
PDF KSCI

중학교 체육교사의 갈등경험에 관한 교육학적 연구 (A Pedagogical Study on the Conflict Experiences of Middle School Physical Education Teachers)

김승용
- 산업융합연구
- /
- 제22권7호
- /
- pp.49-59
- /
- 2024
본 연구는 중학교 체육교사들이 체육교육 현장에서 겪는 다양한 갈등경험을 현상학적 방법을 통하여 그 의미를 심층적으로 이해하고 분석하여 그 본질을 교육학적으로 탐구하는 것이다. 연구방법과 관련하여 연구 참여자는 현직 중학교 체육교사 4명이며 질적 연구방법론의 하나인 Colaizzi의 현상학적 연구방법을 통해 본 연구를 수행하였다. 연구 결과는 다음과 같다. 첫째, 일반적 갈등은 교사와 학생의 갈등으로서 학생지도 및 인간관계로 범주화되었다. 둘째, 직무 갈등은 교사와 교사의 갈등으로서 교직 문화 및 의사소통으로 범주화되었다. 셋째, 관계 갈등은 교사와 학부모와의 갈등으로서 역할기대 및 권력 행사로 범주화되었다. 결론적으로 중학교 체육교사가 경험하는 갈등의 양상을 심층적으로 분석함으로써 다양한 갈등을 효과적으로 해결하고, 특히 교육 현장에서의 갈등을 최소화하여 보다 긍정적인 교육 환경을 조성할 수 있도록 해야 할 것이다.
https://doi.org/10.22678/JIC.2024.22.7.049 인용 PDF

검색결과 102건 처리시간 0.018초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)