• 제목/요약/키워드: 언어 식별

검색결과 162건 처리시간 0.02초

웹 문서의 정보블럭 식별을 통한 효과적인 사용자 프로파일 생성방법 (An Effective User-Profile Generation Method based on Identification of Informative Blocks in Web Document)

  • 류상현;이승화;정민철;이은석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.253-257
    • /
    • 2007
  • 최근 웹 상에 정보가 폭발적으로 증가함에 따라, 사용자의 취향에 맞는 정보를 선별하여 제공하는 추천 시스템에 대한 연구가 활발히 진행되고 있다. 추천시스템은 사용자의 관심정보를 기술한 사용자 프로파일을 기반으로 동작하기 때문에 정확한 사용자 프로파일의 생성은 매우 중요하다. 사용자의 암시적인 행동정보를 기반으로 취향을 분석하는 대표적인 연구로 사용자가 이용한 웹 문서를 분석하는 방법이 있다. 이는 사용자가 이용하는 웹 문서에 빈번하게 등장하는 단어를 기반으로 사용자의 프로파일을 생성하는 것이다. 그러나 최근 웹 문서는 사용자 취향과 관련 없는 많은 구성요소들(로고, 저작권정보 등)을 포함하고 있다. 따라서 이러한 내용들을 모두 포함하여 웹 문서를 분석한다면 생성되는 프로파일의 정확도는 낮아질 것이다. 따라서 본 논문에서는 사용자 기기에서 사용자의 웹 문서 이용내역을 분석하고, 동일한 사이트로부터 얻어진 문서들에서 반복적으로 등장하는 블록을 제거한 후, 정보블럭을 식별하여 사용자의 관심단어를 추출하는 새로운 프로파일 생성방법을 제안한다. 이를 통해 보다 정확하고 빠른 프로파일 생성이 가능해진다. 본 논문에서는 제안방법의 평가를 위해, 최근 구매활동이 있었던 사용자들이 이용한 웹 문서 데이터를 수집하였으며, TF-IDF 방법과 제안방법을 이용하여 사용자 프로파일을 각각 추출하였다. 그리고 생성된 사용자 프로파일과 구매데이터와의 연관성을 비교하였으며, 보다 정확한 프로파일이 추출되는 결과와 프로파일 분석시간이 단축되는 결과를 통해 제안방법의 유효성을 입증하였다.)으로 높은 점수를 보였으며 내장첨가량에 따른 관능특성에서는 온쌀죽은 내장 $2{\sim}5%$ 첨가, 반쌀죽은 내장 $3{\sim}5%$ 첨가구에서 유의적(p<0.05)으로 높은 점수를 보였으나 쌀가루죽은 내장 $1{\sim}2%$ 첨가구에서 유의적(p<0.05)으로 낮은 점수를 보였다. 이상의 연구 결과를 통해 온쌀은 2%, 반쌀은 3%, 쌀가루는 4%의 내장을 첨가하여 제조한 전복죽이 이화학적, 물성적 및 관능적으로 우수한 것으로 나타났다.n)방법의 결과와 비교하였다.다. 유비스크립트에서는 모바일 코드의 개념을 통해서 앞서 언급한 유비쿼터스 컴퓨팅 환경에서의 문제점을 해결하고자 하였다. 모바일 코드에서는 프로그램 코드가 네트워크를 통해서 컴퓨터를 이동하면서 수행되는 개념인데, 이는 물리적으로 떨어져있으면서 네트워크로 연결되어 있는 다양한 컴퓨팅 장치가 서로 연동하기 위한 모델에 가장 적합하다. 이는 기본적으로 배포(deploy)라는 단계가 필요 없게 되고, 새로운 버전의 프로그램이 작성될지라도 런타임에 코드가 직접 이동하게 되므로 버전 관리의 문제도 해결된다. 게다가 원격 함수를 매번 호출하지 않고 한번 이동된 코드가 원격지에서 모두 수행을 하게 되므로 성능향상에도 도움이 된다. 장소 객체(Place Object)와 원격 스코프(Remote Scope)는 앞서 설명한 특징을 직접적으로 지원하는 언어 요소이다. 장소 객체는 모바일 코드가 이동해서 수행될 계산 환경(computational environment

  • PDF

작성자 분석 기반의 공격 메일 탐지를 위한 분류 모델 (A Classification Model for Attack Mail Detection based on the Authorship Analysis)

  • 홍성삼;신건윤;한명묵
    • 인터넷정보학회논문지
    • /
    • 제18권6호
    • /
    • pp.35-46
    • /
    • 2017
  • 최근 사이버보안에서 악성코드를 이용한 공격은 메일에 악성코드를 첨부하여 이를 사용자가 실행하도록 유도하여 공격을 수행하는 형태가 늘어나고 있다. 특히 문서형태의 파일을 첨부하여 사용자가 쉽게 실행하게 되어 위험하다. 저자 분석은 NLP(Neutral Language Process) 및 텍스트 마이닝 분야에서 연구되어지고 있는 분야이며, 특정 언어로 이루어진 텍스트 문장, 글, 문서를 분석하여 작성한 저자를 분석하는 방법들은 연구하는 분야이다. 공격 메일의 경우 일정 공격자에 의해 작성되어지기 때문에 메일 내용 및 첨부된 문서 파일을 분석하여 해당 저자를 식별하면 정상메일과 더욱 구별된 특징들을 발견할 수 있으며, 탐지 정확도를 향상시킬 수 있다. 본 논문에서는 기존의 기계학습 기반의 스팸메일 탐지 모델에서 사용되는 특징들과 문서의 저자 분석에 사용되는 특징들로부터 공격메일을 분류 및 탐지를 할 수 있는 feature vector 및 이에 적합한 IADA2(Intelligent Attack mail Detection based on Authorship Analysis)탐지 모델을 제안하였다. 단순히 단어 기반의 특징들로 탐지하던 스팸메일 탐지 모델들을 개선하고, n-gram을 적용하여 단어의 시퀀스 특성을 반영한 특징을 추출하였다. 실험결과, 특징의 조합과 특징선택 기법, 적합한 모델들에 따라 성능이 개선됨을 검증할 수 있었으며, 제안하는 모델의 성능의 우수성과 개선 가능성을 확인할 수 있었다.

온톨로지 디버깅을 위한 종속 부호 기반 비논리적 공리 탐지 (Dependency Label based Causing Inconsistency Axiom Detection for Ontology Debugging)

  • 김제민;박영택
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권12호
    • /
    • pp.764-773
    • /
    • 2008
  • W3C는 시맨틱 웹 환경에서 온톨로지를 저작하고 공유하기 위해 온톨로지 구축 언어인 OWL을 발표하였다. 현재 OWL 온톨로지의 논리적 정당성을 검사하기 위해서, OWL 추론 엔진들이 소개되고 있다. 그러나 대부분의 추론 엔진들은 정당하지 못한 개념의 탐지 과정 없이 결과만을 보여준다. 본 논문에서는 온톨로지내의 정당하지 못한 개념을 디버깅하기 위해 종속 부호 기반 비논리적 공리(CIA-Causing Inconsistency Axiom) 탐색 기법을 제안한다. 비논리적 공리는 정당하지 못한 개념들을 유발하는 공리들의 집합이다. 비논리적 공리를 탐지하기 위해서는 온톨로지 내에서 비 일관성을 유발하는 공리를 찾아내야 한다. 온톨로지 저작 도구에 정확한 비논리적 공리가 제공된다면, 온톨로지 저작 도구는 온톨로지 내에서의 정당하지 못한 내용을 수정할 수 있도록 수정될 일부 내용만을 보여줄 것이다. 따라서 본 논문은 두 부분에 초점을 맞추었다. 첫 번째, 정당하지 못한 내용을 가진 온톨로지가 주어졌을 때 비 정당성을 유발하는 공리들을 도출하고, 이들의 근원을 식별한다. 두 번째 비 정당성을 유발하는 공리가 탐지되었을 때 이들만을 추출하여, 온톨로지 설계자에게 보여주는 것이다. 따라서 먼저 기존에 발표되었던 테이블로 알고리즘 기반의 결정 모듈을 소개하고, 이보다 향상된 기법인 종속 부호 기반 비논리적 공리 탐지 기법을 제안한다. 본 논문의 결과물은 현재 온톨로지 언어의 기본이 되는 SHOIN 서술 논리 응용시스템에 적용가능하다.

대뇌반구간 한글 단어처리와 색채처리 특성 (Hemispheric Characteristics of Processing Hangul and Color)

  • 한광희;감기택
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.57-63
    • /
    • 1994
  • 인간의 정보처리 과정의 특성을 알아보기 위하여 반구별로 색채와 단어의 처리과정을 분석하였다. 단어와 색깔이라는 두가지 자극 속성이 있는 한 개의 자극에 대하여 각 자극 속성에 대한 판단과정을 반응키를 이용하여 반구별로 알아보았다. 단어에 대한 판단과 색깔에 대한 판단을 반구별로 분석한 결과, 색깔처리나 단어처리에 있어서 반구간 비대칭성은 나타나지 않았으나 색깔에 대한 판단이 단어에 대한 판단보다 신속하게 이루어지는 것으로 나타나 색채가 단어보다 기초적인 자극 속성임을 확인하였다. 단어와 색깔이라는 두가지 자극 속성을 이용한 경우에 한가지 자극속성을 처리할 때 다른 자극속성이 자동적으로 영향을 주는 것으로 나타났으나 그 정도에 있어서 반구간의 차이는 없었다. 그러나 색채가 단어처리를 간섭하는 정도가 단어가 색채처리를 간섭하는 정도보다 큰 것으로 나타나 기존의 스트룹 연구결과들과는 상반되는 결과를 얻었는데 이는 과제의 특성이라는 측면으로 기술되었다. 단어 처리에서 반구간 차이가 발견되지 않은 것은 한글의 시각적 특성과 관련지어 논의되었다. 자극의 한 속성이 자동적으로 다른 속성에 영향을 주지만 그 효과의 크기도 반구별로 차이가 없다는 것은 이전의 반구별 스트룹 효과를 알아본 연구들과 상반되는 결과이다. 따라서 자극속성이 상호영향을 줄 수 있는 좀더 일반적인 상황에서는 한 자극 속성이 다른 자극 속성의 처리에 자동적으로 영향을 주는 효과에서 반구 비대칭성이 발견되지 않으며 스트룹 효과는 두 자극 속성의 관계가 밀접한 특별한 경우에 나타나는 반구비대칭성 효과인 것으로 논의되었다.양 발생과 유의적으로 상관관계가 있었다. 본 연구의 결과는 phenol의 종류에 상관없이 식이 phenol에 조직의 항산화(산화억제)를 통해 암 예방(cancer prevention)에 영향을 미친다는 것을 제시해준다.물을 첨가하여 물내리기를 한 후 김이 오른 후 물내린 쌀가루에 15% 이상의 설탕을 첨가하여 20분간 쪄서 만든 백설기가 가장 바람직하다는 것을 알 수 있었다. 이 실험 중 가장 중요한 조건은 첨가하는 물의 양이 10%이며 첨가하는 당이 설탕일 경우는 김이 오른 후 설탕을 섞어 바로 쪄야 하며 설탕의 양이 15% 이상이라는 것이다. 이 조건은 대체적으로 hardness, adhesiveness, gumminess가 큰 수치를 나타낸다.순구조의 Tonpilz형 초음파 변환기와 비교하여 비록 송파전압감도에 있어서는 약 5 dB 정도의 음향출력의 손실이 불가피하지만, 그 대신 주파수 대역폭을 약 5 재 정도 확대시킬 수 있는 장점이 있기 때문에 이 넓은 주파수 대역을 효과적으로 활용하면 어종식별을 위한 음향산란신호를 정량적으로 수집 및 평가하는 것이 가능하다고 판단된다.n A was 11 ug.이, 0.9 ug/g and 3.7 ug/g in the blood, liver and kidney, respectively.sional-managerial who secure the higher autonomy and stability in their work have the highest life chance in the labor and health, and leisure life

  • PDF

온라인 프로그래밍 학습에서 학습자 특성 및 학습양식과 성취도간의 관계 분석 (Analysis of Learner's Characteristics and Relationship between Learning Styles and Achievements in Online Programming Course)

  • 김지선;김영식
    • 컴퓨터교육학회논문지
    • /
    • 제18권3호
    • /
    • pp.59-68
    • /
    • 2015
  • 본 연구는 온라인 프로그래밍 학습 환경에 참여하는 학습자의 특성 및 학습양식과 성취도간의 관계를 분석하는데 목적이 있다. 분석을 위해, 중 고등학생 104명을 대상으로 Grasha-Reichmann의 학습양식 검사를 실시한 후, 12주간 C언어 프로그래밍 학습과 과제를 수행하였다. 먼저, 학습자 특성에 따른 학습양식 차이 결과, 성별에서 남학생이 여학생보다 의존형이 높았고, 학교급에서 중학생이 경쟁형과 회피형이 고등학생보다 높았다. 성취수준에서는 독립형과 참여형이 차이가 있었다. 학습양식과 성취도와의 관계를 분석한 결과, 독립형(r=.253, p<.01)과 참여형(r=.303, p<.01)이 정적 상관을 보여 두 분석 결과 독립형과 참여형이 성취도와 연관이 있는 학습양식임을 확인할 수 있었다. 또한 학습자들의 주 학습양식에 따른 학습 소감을 조사하여 학습유형별 특징을 분석하였으며, 조사 결과를 통해 학습양식별 온라인 프로그래밍 교수 학습 전략을 도출할 수 있었다.

스포츠 의류 라벨의 표준화 디자인 제안 -시각 정보디자인을 중심으로- (A Proposal for Standardization of Label Design on the Sports apparel -based on the visual information design-)

  • 배정연;김승인
    • 한국융합학회논문지
    • /
    • 제8권12호
    • /
    • pp.243-248
    • /
    • 2017
  • 본 연구는 국외 스포츠의류의 라벨 표준화를 목표로 설정하였다. 라벨의 이론적 고찰을 통해 스포츠의류브랜드의 국외 상의 티셔츠를 중심으로 라벨을 조사하였다. 이를 토대로 32개 라벨 시안을 디자인하여 32명의 남녀 20~30대를 설문 조사하였다. 그 결과 피실험자는 size, fit, washing symbol mark, function의 정보표기를 선호하였다. 이와 같은 결과를 토대로 균형성, 간결성, 위계성, 인지성, 조화성을 고려한 보완된 라벨을 디자인하였다. 연구대상은 20~30대 남녀 12명을 심층 인터뷰하였다. 그 결과 피실험자는 자간과 공간, 정보표기 강조의 최대, 최소화로 인하여 라벨의 인지 선호도를 선정한다는 것을 알 수 있었다. 본 연구의 결과를 토대로 라벨 표준화를 활용하면 의류의 필수 정보를 쉽고 빠르게 인지할 수 있고, 소비자와 브랜드의 원활한 소통이 이루어질 것으로 판단한다. 또한, 언어의 통일화와 표준화된 라벨을 통해 소비자들은 얻고자 하는 정보를 쉽게 식별할 것으로 기대한다.

목록규칙에 있어 가계(家系)의 속성과 관계의 기술 (Describing Attributes and Relationships of Families in Cataloging Rules)

  • 이창수
    • 한국도서관정보학회지
    • /
    • 제46권3호
    • /
    • pp.27-49
    • /
    • 2015
  • 이 연구의 목적은 RDA를 중심으로 FRAD, DACS2, KCR2 등을 분석한 것을 토대로 하여, 한국목록규칙에 있어 가계의 속성과 관계의 기술에 대한 규정 방향을 제시하는 것이다. 가계의 속성 기술은 가계의 이름, 유형, 날짜, 장소, 저명인사, 세습칭호, 언어, 가계사, 식별기호에 관한 사항에 대해 분석하였다. 가계의 관계 기술은 저작과 관련된 가계, 표현형과 관련된 가계, 구현형과 관련된 가계, 개별자료와 관련된 가계 등 각각의 자원과 관련된 가계에 관한 기술을 분석하였고, 가계와 개인 간의 관계, 가계와 가계 간의 관계, 가계와 단체 간의 관계에 대한 기술을 분석하였다. 이 연구는 RDA를 중심으로 목록규칙들에서의 가계의 속성과 관계의 기술에 대하여 분석한 내용을 토대로 추후 한국목록규칙에 이를 적용하기 위한 방안을 제시하였다.

시맨틱웹 기술과 활용방안 (The SemanticWeb Technology and its Applications)

  • 오삼균
    • 정보관리학회지
    • /
    • 제19권4호
    • /
    • pp.298-319
    • /
    • 2002
  • 시맨틱웹은 기계가독형 정의에 기반한 정보의 연계를 통해 웹 자원을 지식화함으로써 정보의 효율적 검색, 통합, 재사용을 도모하는 새로운 기술이다. 시맨틱웹의 구축은 자원에 불변 고유식별자를 부과하는 URI 체제, 각 정보기관에서 생성되는 요소와 속성의 의미 충돌을 방지하는 XML 네임스페이스, 메타데이터 스키마를 활용한 호환적 자원기술을 가능하게 하는 RDF, 메타 데이터 요소 및 이와 연관된 클래스와 속성 관계 정의의 기반이 되는 RDF 스키마, 그리고 RDF 스키마 위에 논리적 추론과 표현력을 강화한 웹 온톨로지 언어 DAML+OIL 및 그 건조자 (constructors)를 삭제 또는 수정 보완한 OWL (Web Ontology Language) 등의 여러 핵심 개념과 기술을 필요로 하는 작업이다. 이 논문은 이러한 개념과 기술의 점진적 발전 양상을 개괄 설명하고, XML/RDF 스키마를 기반으로 메타데이터 요소들을 정의할 경우 도출할 수 있는 상호운용성과 온톨로지의 다양한 활용 방안 등을 고찰한다.

이용자 인식조사를 기반으로 한 참고정보원 메타데이터 항목 제안에 관한 연구 (A Study for Suggesting Online Reference Resources' Metadata Elements Based on the Users' Perceptions)

  • 노영희
    • 한국비블리아학회지
    • /
    • 제21권2호
    • /
    • pp.81-96
    • /
    • 2010
  • 본 연구에서는 이용자 인식조사를 기반으로 하여 온라인 참고정보원용 메타데이터 항목을 제안하고 있다. 설문을 통해 4 관종의 사서들에게 17개 메타데이터 각각의 항목에 대한 필요성에 대해서 물었다. 또한 지난 2년 동안 운영되어온 시스템에의 메타데이터 입력현황과 이용자 인식조사 결과를 비교하였다. 이용자 인식조사와 시스템 입력비율을 기반으로, 17개의 메타데이터 항목 중 정보원 제목, 설명, 주제분야, 출판사, 유형, 식별자, 언어, 범위, 소장위치, 태그 항목은 반드시 포함되어야 할 항목으로 최종적으로 제안할 수 있었다. 또한 제작자와 저작권의 데이터가 실제 시스템에 입력된 비율은 각각 20.20%, 18.30%였으나, 설문응답자들은 각각 82.15%, 82.77%로 이 항목이 필요하다고 응답하였다. 따라서 이 두 개의 항목도 포함시키는 것이 적합하다고 본다. 다만, 시스템에의 입력비율이 3% 이하였던 형태, 원정보원, 날짜, 관련정보원, 기여자 항목에 대해 설문응답자의 거의 70% 이상이 이 모든 항목이 필요하다고 응답하였으므로 이에 대해서는 추가적인 연구가 진행되어야 한다고 본다.

목록규칙에 있어 개인의 속성과 관계의 기술에 관한 연구 (A Study on the Describing Attributes and Relationships of Person in Cataloging Rules)

  • 안서현;이창수
    • 한국비블리아학회지
    • /
    • 제25권3호
    • /
    • pp.235-261
    • /
    • 2014
  • 본 연구의 목적은 한국목록규칙에 개인의 속성과 관계의 기술을 적용하기 위한 방안을 제시하는 것이다. 이를 위해 FRBR과 FRAD 개념 모형과 AACR2R, RDA, KCR2 등의 목록규칙을 비교 분석하였다. 개인의 속성 기술은 개인의 이름, 날짜, 칭호, 이름의 완전형, 성별, 장소, 소속, 언어, 활동분야와 직업, 전기 정보, 식별기호에 관한 사항에 대해 분석하였다. 개인의 관계 기술은 저작과 관련된 개인, 표현형과 관련된 개인, 구현형과 관련된 개인, 개별자료와 관련된 개인 등 각각의 자원과 관련된 개인에 관한 기술을 분석하였고, 개인과 개인 간의 관계, 개인과 가족 간의 관계, 개인과 단체 간의 관계에 대한 기술을 분석하였다. 각종 목록규칙들의 비교를 통해 개인의 속성 기술과 개인의 관계 기술을 분석한 내용을 토대로 추후 한국목록규칙에 이를 적용하기 위한 방안을 제시하였다.