• 제목/요약/키워드: HTML 태그

검색결과 108건 처리시간 0.028초

주피터 노트북에서 자동 평가 시스템의 문제 제시를 위한 방안 탐구 (Exploring how to present the problem of Automatic Assessment system in Jupyter Notebook)

  • 고학능;이영준
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.221-222
    • /
    • 2023
  • 본 연구에서는 주피터 노트북에서 자동 평가 시스템을 활용하기 위한 방안으로 자동 평가 시스템의 문제를 저장하고 제시하는 방안에 대해서 연구하였다. 자동 평가 시스템은 학습자가 직접 프로그래밍을 하고 바로 피드백을 받을 수 있는 장점이 있다. 주피터 노트북에서 자동 평가 시스템을 제공하는 nbgrader와 코들의 장점을 바탕으로 문제 제시 방안은 다음과 같다. 문제는 HTML 태그를 이용해 서식 있는 형태로 서버에 저장한다. 주피터 노트북에서 IPython.display 모듈의 display와 HTML 명령어를 사용하여 문제를 출력하면 코드셀 출력창에 서식 있는 HTML 문서를 출력하여 학습자에게 가독성 있게 문제를 제시할 수 있다.

  • PDF

백과사전 기반 전문용어 태깅 시스템 (Terminology Tagging System using elements of Korean Encyclopedia)

  • 배영준;최호섭;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2005년도 제17회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.167-172
    • /
    • 2005
  • 지금까지 자연언어처리에서의 품사태깅(parts-of-speech tagging) 기술에 대한 연구는 활발히 진행된 반면, 전문용어에 대한 처리 기술은 미비한 점이 많았다. 전문용어에 관련된 연구는 대부분 구축, 표준화, 추출 등에 대한 연구가 많았으나 전문용어 태그 설정과 태깅 기술 연구는 부족한 상황이다. 본 논문에서는 전문용어 태그를 (분야정보: 아이디) 순으로 설정하고 백과사전의 분류 체계를 이용하여 어떤 특정 분야 문서의 전문용어를 자동으로 태깅하는 시스템을 구축하였다. 전문용어 태깅 시스템은 형태소분석기를 사용하지 알고 문맥의 규칙과 조사 어미사전을 이용해 자동으로 태깅을 하게 된다. 이 시스템의 정확률 측정을 위한 정답말뭉치는 웹 상에 공개되어 있는 백과사전 html문서를 이용하였다. 우선 백과사전에 나와있는 용어는 전문용어라고 가정한다. 하나의 문서에는 '용어', '요약', '본문', '이미지', '분류', '참조항목' 등의 정보들이 있다. 이 중 '본문'에는 그 용어에 대한 자세한 설명이 있는데 특정 단어에는 태그로 백과사전 내에 있는 단어를 찾아 볼 수 있게 링크 되어있다. 이 정보를 이용해 태그로 되어있는 것을 설정한 태그로 바꾸고 단계별로 확장 태깅을 해서 정답말뭉치를 만든다. 태깅 시스템과 정답말뭉치를 비교해 정확률을 계산해서 시스템의 성능을 측정하였다.

인터넷 정보 추출을 이용한 웹문서 구조화 (Web Site Construction Using Internet Information Extraction)

웹용 영한 기계번역을 위한 문서 전처리기의 설계 및 구현 (A Preprocessor for English-to-Korean Machine Translation of Web Pages)

  • 안동언;유홍진;서진원;이영우;정성종;여상화;김태완;박동인
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.249-254
    • /
    • 1997
  • 영어 웹 문서를 한국어로 기계번역을 하기 위해서는 HTML 태그를 번역 대상 문장과 분리하는 처리가 필요하다. HTML 태그를 단순히 제거하는 것이 아니라 대상 문장의 기계번역이 종료된 후에 같은 형태의 한국어 웹 문서로 복원하기 위한 방안이 마련 되어야 한다. 또한 문서 전처리기에서는 영어 형태소해석기의 성능을 높이기 위하여 번역 단위가 되는 문장의 인식 및 분리, 타이틀의 처리, 나열된 단어의 처리, 하이픈 처리, 고유명사 인식, 특수 문자 처리, 대소문자 정규화, 날짜 인식 등을 처리하여 문서의 정규화를 수행한다.

  • PDF

웹 페이지 분석을 위한 Web-Picker 설계 및 구현 (Design and Implementation Web-Picker for web page analysis)

  • 이미란;조동섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.603-605
    • /
    • 2003
  • 1990년대 중반에 일어나기 시작한 인터넷 열풍은 웹을 통한 인터넷의 확산으로, 웹 기반 서비스의 발전을 가져왔다. 현재 대부분의 인터넷 서비스는 HTTP를 사용한 일정한 형식의 웹 페이지로, 사용자가 최종적으로 받아보게 되는 형식은 HTML의 태그로써 나타내어진다. 어떠한 태그를 어떻게 사용하였느냐에 따라 그 웹 페이지는 사용자가 사용하기 편리할 수도 있고, 사용하는데 불편할 수도 있다. 따라서 웹사이트의 개발자는 사용자가 편리함과 친숙성을 느낄 수 있도록 웹사이트를 개발해야 한다. 본 논문에서는 이률 해결하기 위해 웹 페이지 분석을 위한 Web-Picker를 제안하고자 한다. Web-Picker를 이용하면 사용자들이 자주 방문하는 웹 페이지의 태그를 분석할 수 있고. 이렇게 분석한 정보를 통해 새로운 웹사이트를 개발하는 개발자들은 사용자가 친숙성과 편리함을 느낄 수 있도록 웹사이트를 개발 할 수 있다.

  • PDF

메타데이터 제지스트리를 이용한 XML-문서 교환 방법 (An XML-Documents Exchanging Method Using A Metadata Registry)

  • 홍종하;양유승;나홍석;백두권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.94-96
    • /
    • 2001
  • 웹 기반의 분산 환경에서 데이터를 공유, 사용하려는 노력은 끊임 없이 계속되어 왔다. 기존의 HTML 문서를 이용할 경우에는 그 언어자체가 가지고 있는 한계성 때문에 효과적으로 문서를 공유하기가 어렵다. 이에 대한 대안으로 XML을 이용한 문서 교환 방법이 제시되고 있다. 하지만 서로 다른 DTD를 기반으로 작성된 XML문서를 교환할 경우에는 문제가 발생하게 된다. DTD가 서로 다른 사용자에 의해서 작성되었기 때문에 XML 문서 내의 태그 뿐만 아니라 문서가 가지고 있는 그 구조 또한 서로 상이하게 된다. 본 논문에서는 상이한 DTD를 기반으로 작성된 XML문서를 교환할 경우에 고려 해야 하는 XML 문서의 구조적 상이성의 예를 보여주고 이에 대한 해결 알고리즘을 제시한다. 문서 구조의 상이성은 적절한 매핑 테이블과 트리 구조를 이용한 태그 변환 방법을 이용하여 해결할 수 있다. 데이터 레지스트리와 본 논문에서 제안한 문서의 구조와 태그 변환 방법을 사용하면 XML 문서를 효과적으로 교환 할 수 있다.

  • PDF

인터넷에서의 개선된 벡터라이징 기법에 관한 연구 (A study of improve vectorising technique on the internet)

  • 김용호;이윤배
    • 한국정보통신학회논문지
    • /
    • 제6권2호
    • /
    • pp.271-281
    • /
    • 2002
  • 현재 대부분의 웹디자이너들은 비트맵 그래픽을 사용하여 고정된 포인트 사이즈로 하이 퀼리티를 보장하고 있지만 이는 파일 크기와 유연성에 결점을 가지고 있다. 특히 배너문자나 광고문자에 하이 퀼리티를 제공하기 위해서는 반드시 다른 비트맵 에디팅 프로그램을 사용해서 작업한 후, 비트맵 데이터로 HTML 문서에 첨가하는 방식을 따를 수 밖에 없다. 또한 HTML 문서 자체적으로 글꼴을 단순하게 출력하는 방법 이외에, 단순한 blink, underline, bold, italic을 제외한 글꼴을 직접 제어하는 HTML Tag 또한 가지고 있지 않기 때문이라고도 할 수 있다. 때문에 폰트의 아웃라인 데이터를 이용한 효과나 외곽선 패턴 분할 같은 작업을 위해서는 벡터에디팅 프로그램과 이미지 에디팅 프로그램, 그리고 최종적으로 HTML 문서에 삽입하는 번거로운 과정을 거쳐야만 하는 문제에 직면하게 된다. 따라서 본 논문에서는 HTML 문서의 폰트에 몇 가지 태그를 새롭게 제시함으로써, 폰트에 더욱 다양한 효과를 줄 수 있는 방법을 제안한다. 제안된 방법은 텍스트 정보 저장시 단순한 제어점과 외곽선 정보만을 가지고 화면 출력하기 때문에 웹브라우저 상에서 인쇄물과 동일한 품질의 한글 문자 표현이 가능하며, 이종의 플랫폼에 상관없이 정확한 문자 표현, 다양한 효과로 문자 표현이 가능하다.

웹 뉴스의 기사 추출과 요약 (Text Extraction and Summarization from Web News)

  • 한광록;선복근;유형선
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권5호
    • /
    • pp.1-10
    • /
    • 2007
  • 뉴스 콘텐츠 등 웹을 통해 제공되는 많은 정보들은 불필요한 클러터를 많이 포함하고 있다. 이러한 클러터들은 문서의 요약, 추출, 검색과 같은 자동화된 정보처리 시스템의 구축을 어렵게 한다. 본 논문에서는 웹 뉴스 콘텐츠를 추출하고 이를 요약하는 시스템을 구축하고자 한다. 추출 시스템은 HTML로 된 뉴스 콘텐츠를 입력받아 DOM 트리와 유사한 요소 트리를 구축하며, 이 요소 트리에서 HTML 태그의 하이퍼링크 속성을 갖는 클러터를 제외하면서 본문을 추출한다. 추출 시스템을 통해 추출된 본문은 요약시스템으로 전달되어 핵심 문장이 추출된다. 요약 시스템은 공기관계 그래프를 이용하여 구성한다. 본 논문에서 구현한 시스템을 통해 추출된 요약 문장은 SMS와 같은 메시지 서비스를 통하여 PDA이나 모바일 폰 등에 전송될 수 있을 것으로 기대된다.

  • PDF

이동단말을 위한 적응적 웹 문서 변환 (Adaptive Conversion of Web Content for Mobile Terminals)

  • 강성천;정광수
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제6권6호
    • /
    • pp.635-642
    • /
    • 2000
  • 본 논문에서는 이동 단말에 적응적으로 웹 문서를 제공할 수 있는 효율적인 문서 변환 방법과 적응적 태그 단순화(tag reduction)를 수행하기 위한 RHTML(Reduced HTML)을 제안하였다. 제안한 적응적 문서 변환 방법은 마크업(markup) 오류 제거 과정을 통해 HTML(HyperText Markup Language) 문서를 XML(Extensible Markup Language)의 응용 문서로 변환한다. 이를 통해 웹 문서는 DOM(Document Object Model)을 사용하여 트리 구조로 손쉽게 다루어질 수 있게 되며, 따라서 이동 단말에서 마크업 오류를 수정하는 하드웨어의 부하를 제거할 수 있다. 또한 제안한 문서를 단순화하는 과정에서는 RHTML에 정의 된 3가지의 DTD(Document Type Definition)중 하나를 참고하여 이동 단말에 적응적으로 웹문서를 제공한다.

  • PDF

기독교 관련 웹 사이트 내 색인에 관한 연구 (A Study on Christian Website Indexing)