Search | Korea Science

Sentence Cohesion & Subject driving Keywords Extraction for Document Classification (문서 분류를 위한 문장 응집도와 주어 주도의 주제어 추출)

Ahn Heui-Kook;Roh Hi-Young
- Proceedings of the Korean Information Science Society Conference
- /
- 2005.07b
- /
- pp.463-465
- /
- 2005
문서분류 시 문서의 내용을 표현하기 위한 자질로서 사용되는 단어의 출현빈도정보는 해당 문서의 주제어를 표현하기에 취약한 점을 갖고 있다. 즉, 키워드가 문장에서 어떠한 목적(의미)으로 사용되었는지에 대한 정보를 표현할 수가 없고, 문장 간의 응집도가 강한 문장에서 추출되었는지 아닌지에 대한 정보를 표현할 수가 없다. 따라서, 이 정보로부터 문서분류를 하는 것은 그 정확도에 있어서 한계를 갖게 된다. 본 논문에서는 이러한 문서표현의 문제를 해결하기위해, 키워드를 선택할 때, 자질로서 문장의 역할(주어)정보를 추출하여 가중치 부여방식을 통하여 주어주도정보량을 추출하였다. 또한, 자질로서 문장 내 키워드들의 동시출현빈도 정보를 추출하여 문장 간 키워드들의 연관성정도를 시소러스에 담아내었다. 그리고, 이로부터 응집도 정보를 추출하였다. 이 두 정보의 통합으로부터 문서 주제어를 결정함으로서, 문서분류를 위한 주제어 추출 시 불필요한 키워드의 삽입을 줄이고, 동시 출현하는 키워드들에 대한 선택 기준을 제공하고자 하였다. 실험을 통해 한번 출현한 키워드라도, 문장을 주도하는 주어로서 사용될 경우와 응집도 가중치가 높을 경우에 주제어로서의 선택될 가능성이 향상되고, 문서분류를 위해 좀 더 세분화된 키워드 점수화가 가능함을 확인하였다. 따라서, 선택된 주제어가 문서분류의 정확도에 있어서 향상을 가져올 수 있을 것으로 기대한다.
PDF

초등정보과학영재를 위한 기초기술소양교육 방안

오성훈;이재호
- Proceedings of the Korean Society for the Gifted Conference
- /
- 2003.11a
- /
- pp.187-197
- /
- 2003
오늘날 지식정보사회에서는 국가의 과학기술이 그 나라의 국가 경쟁력을 좌우하게 되기 때문에 우수한 잠재력을 가진 영재를 조기에 육성하고 교육하는 일은 매우 중요하다. 특히 요즘처럼 지식정보사회로의 전환이 급속도로 진행되고 있는 현실을 고려해 볼 때에 영재교육 중 정보과학영재교육의 중요성은 더욱 커지고 있다. 사람들은 흔히‘영재’라는 이유로 기초가 되는 부분을 소홀히 하고 넘어가는 경우가 많다. 정보과학영재를 위한 교육과정 중 기초기술소양교육도 마찬가지였다. 대부분 프로그래밍 같은 고급기술을 요하는 것만 중시하지 워드프로세서나 프리젠테이션 프로그램 활용 같은 컴퓨터 사용에 기본이 되는 것들은 간과하고 넘어가는 경우가 많았다. 하지만 기초가 단단해야 튼튼한 건물을 지을 수 있고, 뿌리가 깊어야 바람에 안 흔들리듯이 정보과학영재를 위한 교육과정 중 기초기술소양교육의 중요성은 무시할 수가 없다. 특히 컴퓨터에 대한 강한 호기심과 높은 창의력등 정보과학영재로써의 많은 것을 갖추고 있지만 단지 기초기술이 부족한 아동은 정보과학영재가 아니라고 단정지어 말 할 수가 없기 때문에 기초기술소양교육은 매우 필요한 것이다. 따라서 본 논문에서는 정보과학영재교육의 필요성과 초등정보과학영재를 위한 기초기술소양교육의 필요성을 생각해 보고, 현재 일반적으로 이루어지고 있는 기초기술소양교육을 분석해 보고 단편적인 기능이 중심이 아닌 문제 해결 중심의 새로운 기초기술소양교육방안을 제시하고자 한다.
PDF

Design of Activity Based Costing Management System in Home Care (가정간호사업의 활동기준원가관리시스템 설계)

이수정;임정은
- Proceedings of the Korean Information Science Society Conference
- /
- 2004.10b
- /
- pp.427-429
- /
- 2004
진료 및 간호서비스는 다른 제조업과는 달리 무형의 서비스에 대한 간접비의 비율이 두드러지는 특성을 지니며, 이러한 특성으로 인해 의료기관의 전략적 계획수립, 수익성 분석, 경제성 분석, 의료서비스 제공의 질 관리 등의 의사결정에 적극 활용되어야 하는 원가 분석에 어려움을 겪어왔다. 전문 간호 분야인 가정간호는 1회 방문 시에 다양한 활동들이 모여서 가정간호서비스가 수행되므로 가정간호의 원가분석에는 각 행위들이 모인 활동에 대한 분석에 근거한 정확한 원가 정보가 요구되고 있다. 활동기준원가의 기본 요소는 자원, 활동, 자원 동인, 활동 동인, 원가 대상이며 이에 따라 가정간호사업에서 활동기준원가의 각 요소를 정의하고 전통적 원가 계산이 아닌 활동을 중심으로 가정간호사업의 업무 알고리즘을 분석하여 활동기준원가관리시스템을 설계한다. 가정간호사업의 활동기준원가관리시스템은 가정간호의 효율적 운영과 의료기관의 경영 개선과 항께 실질적 원가계산을 통해 정부가 건강 보험 수가를 결정하고, 보험 수가의 적절성을 평가하는데 중요한 기초 자료를 제공하게 될 것으로 기대한다.
PDF

Study on the downmix method of parametric multichannel audio codec (파라메트릭 멀티채널 오디오 코덱의 다운믹스 방식에 대한 연구)

Moon, Han-Gil;Lee, Chu-Lwoo
- Proceedings of the KIEE Conference
- /
- 2008.10b
- /
- pp.304-305
- /
- 2008
DVD/BD 및 HDTV의 보급으로 인해 다수의 오디오 컨텐츠들이 멀티채널(5.1채널 이상) 형식으로 제작되고 있다. 오디오 정보를 담고 있는 물리적인 채널의 수가 증가하면, 이에 따라 정보량도 선형적으로 증가하게 된다. 선형적으로 증가된 정보를 기존의 오디오 코덱을 이용해 큰 압축할 경우, 압축에 필요한 비트레이트의 선형적인 증가를 피할 수 없다. 최근 채널 수 증가로 야기되는 비트레이트의 증가를 최소화하고 효율적으로 멀티채널 오디오 신호를 압축할 수 있는 방법으로 MPEG surround와 같은 파라메트릭 멀티채널 오디오 코딩 방식이 제안되었다. 파라메트릭 멀티채널 오디오 코딩 방식의 경우, 멀티채널 오디오 신호를 채널 수가 감소된 다운믹스 신호와 다운믹스 신호로부터 다시 멀티채널 오디오 업믹스 하는데 필요한 파라미터로 표현하는 방식이다. 따라서 다운믹스 방식 및 업믹스에 필요한 파라미터에 따라 업믹스된 멀티채널 오디오 신호의 품질이 달라진다. 본 논문에서는 MPEG surround에서 사용하고 있는 기존의 ITU-R 다운믹스 방식의 문제점을 실제 멀티채널 오디오 신호의 사례를 통해 제시하고 이 문제점을 해결하기 위한 새로운 다운믹스 방식과 파라미터를 제안하고자 한다.
PDF

Cyber Shopping Mall Design Using Intelligent Sale Clerk Agent (지능형 판매점원 에이전트를 이용한 사이버 쇼핑몰 설계)

피수영;김두완;정환묵
- Proceedings of the Korean Information Science Society Conference
- /
- 2000.04b
- /
- pp.280-282
- /
- 2000
인터넷과 멀티미디어 기술의 급속한 성장에 따라 웹을 기반으로 한 전자상거래가 많은 관심을 받고 있다. 구매자들은 보다 합리적이고 현명해졌고 또한 개성화 경향의 심화로 구매자 자신에 맞는 특별한 서비스를 원하고 있다. 그러나 현재의 대부분의 전자상거래 서비스는 구매자가 물건의 모습이나 사양을 보고 선택하는 상품 카탈로그 수준의 상태에 있다. 구매자의 욕구를 만족시키기 위해서는 단순한 상품정보를 제시하는 것에서 벗어나 판매점원의 지식을 이용한 판매점원 에이전트가 필요하다. 이러한 판매점원 에이전트를 이용하면 고객은 상품 탐색 시간을 급격히 줄일 수 있고 구매자 취향에 맞는 쇼핑을 할 수가 있으며 판매자 입장에서는 차별화 된 고객관리를 할 수가 있다. 따라서 본 논문에서는 실제 상점에서 존재하는 판매점원의 일을 대신해 주는 사이버상의 판매점원을 지능형 에이전트, 즉 지능형 판매점원 에이전트(ISCA : Intelligent Sale Clerk Agent)를 이용하여 구매자의 취향에 적합한 상품들을 쇼핑할 수 있도록 하고자 한다.
PDF

Recognition of global character type in initial phase of hangul character identification (한글 인식 초기과정의 글자유형 분류처리)

Kim, Mi-Hyun;Lee, Mann-Young
- Annual Conference on Human and Language Technology
- /
- 1992.10a
- /
- pp.525-532
- /
- 1992
본 연구는 한글 글자를 지각하는데 있어서 인식의 초기 단계에 사람들이 글자의 유형을 처리하는지 알아보기 위하여 시행되었다. 글자인식의 초기 단계에서 유형 분류를 한다는 것은 이미 인공시각 연구자들에 의해 시뮬레이션을 통해 검증된 바 있으나, 그것이 심리학적으로 실재성을 가지는지에 대한 검토는 없었으므로 본 연구를 실시하게 된 것이다. 먼저 예비실험을 통해 본 실험에서 쓸 자극제시시간을 구했으며, 실험은 한글 글자 중 낱자 수가 두 개인 유형 1, 2 의 글자를 자극으로 쓰는 경우와, 낱자 수가 세개인 유형 3, 4, 5 의 글자를 자극으로 쓰는 경우를 나누어서 실시하였다. 실험 1 과 실험 2 의 결과는 모두 가설을 강력히 지지하는 것으로 나왔다. 즉 자극제시시간을 역치하로 했을 경우 글자의 정답율과 유형의 정답율을 비교해 보았을 때 유형의 정답율이 유의하게 높았으며, 이는 아직 글자의 의미처리가 일어나기 전인 인식의 초기 단계에서 이미 글자의 유형에 대한 처리가 일어났음을 시사해 주는 것이다.
PDF

Korean Named Entity Recognition using D-Tag (D-Tag를 이용한 한국어 개체명 인식)

Eunsu Kim;Sujong Do;Cheoneum Park
- Annual Conference on Human and Language Technology
- /
- 2022.10a
- /
- pp.35-40
- /
- 2022
본 논문에서는 시퀀스 레이블링 문제(sequence labeling problem)인 개체명 인식에 사용할 새로운 태깅 포맷인 Delimiter tag (D-tag)를 소개한다. 시퀀스 레이블링 문제에서 사용하는 BIO-tag 포맷은 개체명 레이블을 B (beginning)와 I (inside) 의미의 레이블로 확장하여 타겟 클래스의 수가 2배 증가한다. 또한 BIO-tag 포맷을 사용할 경우, 모델이 B와 I 를 잘못 분류하는 문제가 발생하며, 레이블 수가 많은 세부 분류 개체명의 경우에는 label confusion을 야기한다. 본 논문에서 제안한 D-tag 포맷은 타겟 클래스의 수를 증가시키지 않기 때문에 앞서 언급한 문제를 해결할 수 있다. 실험 결과, D-tag를 사용하여 학습한 모델이 BIO-tag를 사용한 경우보다 더 좋은 성능을 보여, 유망함을 확인하였다.
PDF

A Priority Queue-Based Photo Clustering Method Using Temporal Information (촬영시각 차이를 고려한 우선순위 큐 기반의 사진 클러스터링)

Ryu, Dong-Sung;Kim, Kwang-Hwi;Cho, Hwan-Gue
- Proceedings of the Korea Information Processing Society Conference
- /
- 2011.04a
- /
- pp.497-500
- /
- 2011
이전 필름 카메라 시대에는 한 필름에 촬영 가능한 사진의 수가 제한되고 인화와 현상에 대한 비용과 시간 소모로 인해, 꼭 필요하거나 중요한 순간에 사진을 촬영하였다. 그러나 최근에는 디지털 카메라의 보급과 대용량화된 메모리로 인해, 이전의 필름 카메라 시대와는 달리 일반 사람들도 한번에 많은 양의 사진을 촬영하는 일이 많아졌다. 이와 같이 관리해야 할 사진의 수가 많아질수록 사진을 분류하고 관리하는 작업에 많은 노력과 비용이 소모된다. 본 논문에서는 윈도우와 우선순위 큐를 이용하여, 촬영시각 문맥 (temporal context)의 흐름이 약한 순서대로 사진들을 클러스터링하는 방법을 제안한다. 제안한 방법의 평가를 위해서, Cooper 가 제안한 이벤트 클러스터링 방법과 정확도와 재현율을 비교하였으며, 사진 촬영 시각 차이의 분포의 편차가 작을수록, 제안한 클러스터링 방법이 높은 정확도를 보였다. 본 논문에서 제안한 촬영 시각 클러스터링은 많은 수의 사진들을 이벤트 기반으로 자동 분류하는데 활용될 수 있으며, 클러스터링된 정보들을 그룹별로 시각화하기 위한 인터페이스를 개발하는 것을 향후 연구과제로 제시한다.
https://doi.org/10.3745/PKIPS.y2011m04a.497 인용 PDF

Attention-Based Ensemble for Mitigating Side Effects of Data Imbalance Method (데이터 불균형 기법의 부작용 완화를 위한 어텐션 기반 앙상블)

Yo-Han Park;Yong-Seok Choi;Wencke Liermann;Kong Joo Lee
- Annual Conference on Human and Language Technology
- /
- 2023.10a
- /
- pp.546-551
- /
- 2023
일반적으로 딥러닝 모델은 모든 라벨에 데이터 수가 균형을 이룰 때 가장 좋은 성능을 보인다. 그러나 현실에서는 특정라벨에 대한 데이터가 부족한 경우가 많으며 이로 인해 불균형 데이터 문제가 발생한다. 이에 대한 해결책으로 오버샘플링과 가중치 손실과 같은 데이터 불균형 기법이 연구되었지만 이러한 기법들은 데이터가 적은 라벨의 성능을 개선하는 동시에 데이터가 많은 라벨의 성능을 저하시키는 부작용을 가지고 있다. 본 논문에서는 이 문제를 완화시키고자 어텐션 기반의 앙상블 기법을 제안한다. 어텐션 기반의 앙상블은 데이터 불균형 기법을 적용한 모델과 적용하지 않은 모델의 출력 값을 가중 평균하여 최종 예측을 수행한다. 이때 가중치는 어텐션 메커니즘을 통해 동적으로 조절된다. 그로므로 어텐션 기반의 앙상블 모델은 입력 데이터 특성에 따라 가중치를 조절할 수가 있다. 실험은 에세이 자동 평가 데이터를 대상으로 수행하였다. 실험 결과로는 제안한 모델이 데이터 불균형 기법의 부작용을 완화하고 성능이 개선되었다.
PDF

실험계획을 평가하기 위한 측도로서의 상호정보

Jang, Dae-Heung
- Proceedings of the Korean Statistical Society Conference
- /
- 2005.05a
- /
- pp.87-93
- /
- 2005
통계적 품질관리나 실험계획법에서 요인의 수가 과다하게 많은 경우 주로 직교배열을 이용하여 실험을 한다. 그러나 직교배열을 쓰지 못할 때 우리는 근사직교배열을 이용하게 되는 데 이 때 근사직교배열의 직교성의 정도를 평가할 수 있는 기준으로서 상호정보를 이용할 수 있다.
PDF

Search Result 2,852, Processing Time 0.031 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)