• 제목/요약/키워드: 카테고리화

검색결과 168건 처리시간 0.033초

계량화된 지식 추상화 계층을 이용한 협력적 질의 처리 (Cooperative Query Answering Using the Metricized Knowledge Abstraction Hierarchy)

  • 신명근
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권3호
    • /
    • pp.87-96
    • /
    • 2006
  • 데이터베이스 시스템에서 협력적 질의응답이란 질의 내용과 정확히 일치하는 자료뿐만 아니라 좀 더 넓은 인근 범위의 자료 또는 근사적인 자료를 검색해 주는 것을 말한다. 협력적 질의응답은 질의 분석, 질의 유연화, 유연화된 질의에 따른 근사적 자료 제공의 세 단계로 이루어져 있다. 질의 유연화를 수행하기 위해 의미적 관계를 표현하는 지식추상화 방법과 자료 사이의 정량적인 유사도를 거리로 표현하는 방법들이 지식표현 방법으로 사용된다. 본 논문에서는 보다 효과적으로 질의 유연화 단계를 지원하기 위해, 다단계 데이터 추상화 계층과 거리 척도를 지원하는 계량화된 지식추상화 계층(MKAH: Metricized Knowledge Abstraction Hierarchy)을 제안한다. MKAH는 카테고리화 될 수 있는 자료에 대해 질의 유연화를 효과적으로 지원하며 두 값 사이의 정량적인 의미상의 유사도를 제공하여, 질의 결과에 순위가 매겨질 수 있도록 한다. MKAH의 실용성과 효율성을 검증하기 위하여 경력직 검색 분야에 대한 원형 시스템을 구현해보았다. 다양한 실험을 통하여 MKAH가 풍부한 의미 표현이 가능하면서 질적으로도 높은 거리 척도를 제공해 준다는 것을 보였다. 그 결과 MKAH를 채택하는 도메인은 다른 정량적인 숫자 도메인과 호환될 수 있다는 점과, 큰 규모의 시스템을 만드는 데에도 장점이 있음을 확인하였다.

  • PDF

전자해도 화면표현결과의 비교분석 연구

  • 최현수;오세웅;심우성
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2014년도 춘계학술대회
    • /
    • pp.135-137
    • /
    • 2014
  • 국제수로기구(IHO)는 전자해도의 화면표현과 데이터 내용 표준화를 위해 각각 S-52, S-57 표준을 개발하였고 전자해도 시스템(Electronic Chart Display and Information System, ECDIS)과 같은 다수의 전자해도 관련 시스템들이 개발 및 활용되고 있다. 이러한 전자해도 관련 시스템은 S-52를 기반으로 전자해도 데이터를 화면에 표출하고 있으므로 화면에 표현된 결과가 어느 시스템에서나 동일하여야 하나, 실제로는 표준 준수 정도에 따라 화면상 표현결과가 상이한 문제가 발생하고 있다. 본 연구에서는 상용 전자해도 관련 프로그램과 국제 표준에 맞춰 자체적으로 개발한 전자해도 뷰어 프로그램을 이용하여 기존 시스템들의 전자해도 화면표현결과를 비교 및 분석하였다. 이에 대한 원인 항목을 특징별로 카테고리화하여 분류하여 분석 하였으며, 이를 통해 화면표현에 있어 일관성 있는 전자해도 시스템 수립을 위한 방안을 제시하였다.

  • PDF

이러닝을 위한 클러스터 기반 학습 자원의 저장 기법 (Storing Method of Learning Resources based on Cluster for e-Learning)

  • 윤홍원
    • 한국콘텐츠학회논문지
    • /
    • 제7권1호
    • /
    • pp.155-160
    • /
    • 2007
  • SCORM에서 학습 자원은 공유 가능 콘텐츠 객체 또는 하나 이상의 애셋(asset)으로 구성된다. 이러닝 환경에서 애셋을 신속하게 검색하고 재사용할 수 있는 저장 방법이 필요하지만 아직 관련된 연구가 거의 없다. 본 논문에서는 클러스터에 기반을 둔 애셋의 저장 방법을 제안하고 수학적으로 정형화하여 정의하였다. 또한, 애셋을 평가하는 기준과 각 애셋을 평가하는 절차를 제시하였다. 실험을 통하여 제안한 클러스터저장 방법에 기반을 둔 검색이 텍스트 카테고리화에 기반한 검색보다 처리시간과 정확도 측면에서 성능이 우수함을 보였다.

사용자의 동적인 관심변화를 학습하는 개인화된 뉴스 에이전트 (Learning Dynamic Changes of User Interests in Personalized News Agent)

  • 고경희;오경환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.82-84
    • /
    • 2001
  • 정보여과 시스템은 사용자의 관심사를 정확하게 알아내야 하고(specialization), 시간에 따른 변화에 적응할 수 있어야 하며(adaptation), 사용자의 잠재적인 관심사를 발견하기 위해 새로운 도메인을 탐험할 수 있어야 한다(exploration). 본 논문에서는 온라인 뉴스 기사를 여과하여 사용자와 관련이 있는 뉴스 기사를 추천하는 뉴스 에이전트를 설계, 구현하고자 한다. Specialization, adaptation의 두 가지 요구사항을 충족시키기 위해 사용자의 관심사를 도메인별로 분리하고 각 도메인은 long-term과 short-term으로 나눈다. Exploration의 요구사항을 충족시키기 위해서는 카테고리 절차(crossover) 연산을 사용한다. 실험 결과, 사용자에 대한 사전 정보가 전혀 없는 상태에도 불구하고 빠른 적응능력을 보였다. long-term과 short-term의 분리는 사용자의 관심사에 급격한 변화가 일어난 후에도 시스템이 빠르게 적응할 수 있음을 보여주었다. 또한 카테고리 교차 연산을 통해 사용자의 새로운 관심사 탐험을 수행해 낼 수 있음을 보여주었다.

  • PDF

IoT 악성코드 분석을 위한 op 코드 카테고리 시퀀스 특징과 기계학습 알고리즘 활용 (Opcode category sequence feature and machine learning for analyzing IoT malware)

  • 문성현;김영호;김동훈;황두성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.914-917
    • /
    • 2021
  • IoT 기기는 취약한 아이디와 비밀번호 사용, 저사양 하드웨어 등 보안 취약점으로 인해 사이버 공격 진입점으로 이용되고 있다. 본 논문은 IoT 악성코드를 탐지하기 위한 op 코드 카테고리 기반 특징 표현을 제안한다. Op 코드의 기능별 분류 정보를 이용해서 n-gram 특징과 엔트로피 히스토그램 특징을 추출하고 IoT 악성코드 탐지를 위한 기계학습 모델 평가를 수행한다. IoT 악성코드는 기능 개선과 추가를 통해 진화하였으나 기계학습 모델은 훈련 데이터에 포함되지 않은 진화된 IoT 악성 코드에 대한 예측 성능이 우수하였다. 또한 특징 시각화를 이용해서 악성코드의 비교 탐지가 가능하다.

개인 기호정보 필터링을 사용한 모바일 시맨틱 검색 (Mobile Semantic Search using Personal Preference Filtering)

  • 전호철;김태환;최중민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.30-33
    • /
    • 2007
  • 본 논문에서는 모바일폰을 통한 시맨틱 검색 및 개인 기호정보를 사용한 검색 결과의 필터링이 가능한 시스템을 제안 하고자 한다. 시스템에서는 모바일 컨텐츠와 웹 컨텐츠의 검색 연동, 사용자 기호정보의 유 무선 장치의 공유 및 유 무선 장치간 검색 결과의 공유를 지원한다. 모바일폰의 컴퓨팅 능력을 고려해 모바일폰에는 사용자 인터페이스만을 유지 하도록 한다. 모바일폰을 통한 시맨틱 검색을 지원하기 위해 시스템은 실험적으로 뉴스 도메인에 국한된 카테고리에 대한 분류 체계 온톨로지를 구축하며, 각 카테고리간 관계를 설정 한다. 또한, 개인 기호정보를 통한 검색 결과의 필터링을 위해 사용자 기호정보를 XML 형태의 벡터 모델로 유지하며, 이는 서버의 데이터베이스에 각 사용자 계정으로 저장하고 공유한다. 모바일폰의 여러 단점을 극복하고 장점을 극대화 하기 위해 검색 결과를 서버에 저장하고 이를 유 무선 장치간 상호 공유 할 수 있도록 한다. 본 논문에서는 시스템의 아키텍처와 구성 및 주요 기능에 대해서 기술하고자 한다.

HEVC의 SAO 병렬화 성능 비교 (Comparison of Parallelization for HEVC SAO)

  • 조현호;심동규
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 하계학술대회
    • /
    • pp.117-118
    • /
    • 2013
  • 본 논문에서는 HEVC (High Efficiency Video Coding) SAO (Sample Adaptive Offset)의 병렬화 성능을 비교한다. HEVC 의 참조 소프트웨어인 HM-10.0 에서는 SAO 수행 과정의 연산량 및 메모리 접근을 최소화하고 카테고리 계산 과정에서 SAO 수행 전의 픽셀값을 사용하기 위해서 라인 버퍼를 사용한다. 그러나 이러한 라인버퍼의 사용은 SAO 에 대해 데이터-레벨의 병렬화를 적용하기 어렵게 만드는 주요 요인이다. 본 논문에서는 HEVC 디블록킹 필터가 적용된 픽쳐를 추가 메모리에 복사하는 구현 방식과 HM-10.0 의 SAO 구현 방식 각각에 대해 데이터-레벨 병렬화를 적용하고 각각의 성능을 비교 분석하였다. 실험 결과, HEVC 디블록킹 필터가 적용된 픽쳐를 추가 메모리에 복사하는 구현 방식은 데이터-레벨 병렬화의 구현은 쉽지만, 디블록킹 필터링 된 픽쳐를 추가 메모리에 복사하는 부분 때문에 HM-10.0 기반의 병렬화보다 복호화 성능이 저하될 수 있음을 확인하였다. 이에 반해 CTU 의 행 단위로 병렬 수행될 영역을 분할하는 방식은 구현의 용이성과 병렬화 성능을 동시에 얻을 수 있음을 확인하였다.

  • PDF

HMM을 이용한 연속음성인식 시스템의 화자적응화에 관한 연구 (A Study on Speaker Adaptation of HMM in a Continous Speech Recognition System)

  • 김상범
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.100-104
    • /
    • 1995
  • 일반적으로 화자적응화는 이미 학습되어 있는 불특정 화자 모델을 표준모델로 하고 소량의 적응화용 발화로 추가적인 학습을 실시하여 특정화자 모델의 성능에 가깝게 하는 기술로서 연속음성 인식에 있어서 매우 중요하다. ML 추정법을 이용한 화자적응화는 카테고리마다 모델의 학습패턴들을 다수개 준비한 후 학습시에 일괄적으로 적용시켜 모델 파라메터를 추정 갱신하므로 추가되는 화자데이터에 대해 데이터를 모두 공급하여야 한다. 본 연구에서는 문발화 데이터의 음절단위를 자동추출한 후 추가되는 화자데이터가 주어질 때 마다 적응화할 수 있는 화자적응화 방법을 검토하였다. 이 방법은 문발화 데이터를 잘라내지 않고 음절 단위를 자동추출시켜 추가 데이터마다 최대 사후확률 추정법을 이용하여 적응화 시키는 것으로 수소의 데이터로서도 적응화를 가능하게 하는 것이다. 본 연구에서 사용되는 음성데이터는 신문사설에서 발췌한 연속음성 10문장을 사용하고, 이 음성 데이터중 6명분은 HMM 학습용으로 하고 나머지 3명분은 적응화용 및 평가용 데이터로 사용하였다. 6명의 화자를 DDCHMM으로 학습하고 나머지 3명분을 MAP법으로 적응화시켰다. 그 결과 적응전과 비교해 볼 때 약 32%의 인식율 향상을 얻을 수 있었다.

  • PDF

정보시스템에서 퍼지용어의 확장된 AHP를 사용한 레벨화와 유사성 측정 (A Leveling and Similarity Measure using Extended AHP of Fuzzy Term in Information System)

  • 류경현;정환묵
    • 한국지능시스템학회논문지
    • /
    • 제19권2호
    • /
    • pp.212-217
    • /
    • 2009
  • 특정 분야의 용어를 표현하는 전문용어 사이의 계층관계를 학습하는 방법은 규칙기반학습방법, 통계기반학습방법 등이 있다. 본 논문에서는 문서에서 추출된 퍼지용어 정보를 바탕으로 한 온톨로지 구조를 카테고리화하여 퍼지용어의 전문성을 이용하여 주어진 퍼지용어의 상위어 후보를 레벨화한 후 퍼지용어 의미유사도를 계산하여 선택된 후보들 중에서 최적의 상위어후보를 결정한다. 즉, 퍼지용어의 전문성을 레벨화하기 위한 확장된 AHP방법은 퍼지용어사이의 비교를 통해 가중치나 상대적 중요성을 결정한 후 퍼지집합의 Min연산자와 다이스계수, Min+다이스계수방법들을 비교한다. 이 방법들은 퍼지용어 의미유사도에 따라 문서들이 가지는 의미론적 내용과 관계의 식별을 바탕으로 보다 더 정확하게 문서를 분류할 수 있고 자연어처리 등 많은 분야에 활용될 수 있을 것이다.

서울시 저영향개발(LID) 시범 시설에 대한 편익 특성 연구 (Study of Benefit Characteristics for Low Impact Development (LID) Facilities demonstrated in Seoul Metropolitan)

  • 이승원;김이호
    • 대한환경공학회지
    • /
    • 제38권6호
    • /
    • pp.299-308
    • /
    • 2016
  • 서울시는 '건강한 물순환 도시' 조성을 비전으로 선포하고 도시 물환경 악화에 따른 문제를 해결하기 위한 노력을 기울이고 있다. 이를 위해 서울시는 빗물의 침투 및 저류 기능 등을 이용하는 저영향개발(LID) 시설의 설치를 확산시키기 위한 정책 및 제도 개선을 추진하고 있다. 이러한 저영향개발 시설은 공공이 선도하는 물순환 도시 조성과 이를 위한 빗물의 표면 유출 억제와 물이용 효율화를 목적으로 하고 있다. 또 악화된 물순환과 물환경을 회복하기 위해 다양한 저영향개발 시설이 설치 및 운영되고 있다. 그러나 이에 대한 체계적인 경제성 평가를 위한 편익 분석 방안은 미흡한 실정이다. 따라서 본 연구에서는 저영향개발 시설의 경제적 환경적 사회적 편익을 다각적으로 분석하기 위해 저영향개발 시설별로 물 에너지 대기질 개선 기후변화 대응의 4개 카테고리별로 편익 분석항목을 선정하였다. 이러한 카테고리별 분류에 따른 직간접인 편익효과의 정량화 및 가치 평가 결과, 각 시설별로 연간 1,191원의 단위면적 당 편익이 발생하는 것으로 산정되었다. 분석 항목별 편익 분포 특성은 시설의 특성에 따라 다양한 것으로 나타났다(물: 30~90%, 에너지: 4~44%, 대기질 개선: <1~2%, 기후변화 대응: 5~22%). TBL 분석 결과, 시설별로 경제적 편익의 비중이 가장 큰 것으로 나타났으며(75~90%), 환경적 편익(<1~2%) 및 사회적 편익(9~24%)이 산정되었다. 향후, 현재의 개별 저영향개발 시설에 대한 편익 분석 방안을 기반으로 단지 및 지구단위의 물순환 연계 시스템이 적용될 경우, 도시 열섬 현상 및 홍수 재해 예방 등 저영향개발 시설 운영의 편익에 대한 시너지 효과 등을 평가할 수 있을 것으로 기대된다.