• 제목/요약/키워드: PAGE

검색결과 3,688건 처리시간 0.025초

Mining Parallel Text from the Web based on Sentence Alignment

  • Li, Bo;Liu, Juan;Zhu, Huili
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2007년도 정기학술대회
    • /
    • pp.285-292
    • /
    • 2007
  • The parallel corpus is an important resource in the research field of data-driven natural language processing, but there are only a few parallel corpora publicly available nowadays, mostly due to the high labor force needed to construct this kind of resource. A novel strategy is brought out to automatically fetch parallel text from the web in this paper, which may help to solve the problem of the lack of parallel corpora with high quality. The system we develop first downloads the web pages from certain hosts. Then candidate parallel page pairs are prepared from the page set based on the outer features of the web pages. The candidate page pairs are evaluated in the last step in which the sentences in the candidate web page pairs are extracted and aligned first, and then the similarity of the two web pages is evaluate based on the similarities of the aligned sentences. The experiments towards a multilingual web site show the satisfactory performance of the system.

  • PDF

운영체제의 지원 없이 이중 페이지를 지원하는 TLB (A dual TLB supporting two pages without operating system aid)

  • 이정훈;이장수;김신덕
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (A)
    • /
    • pp.42-44
    • /
    • 2000
  • TLB 성능을 높이기 위한 기존의 3가지 주요 연구방향은, TLB 엔트리 계수를 최대한 증대 시키는 방법, 페이지 크기(page size)를 크게 증대 시키는 방법, 다중 페이지 크기(multiple page sizes)을 지원하는 방법 등의 연구가 제시되어 왔다. 이러한 방법들 중 다중 페이지 크기를 지원하는 방법이 가장 우수한 성능을 제공하는 방법이지만, 이작 어떠한 운영체제(operting system)도 다중 페이지를 사용자(user) 영역까지 지원하고 있지는 않은 상태이다. 따라서 다중 페이지의 효과를 살리기 위해 운영체제의 도움 없이 이중 페이지를 지원하면서 낮은 가격(low cost)으로 높은 성능(high performance) 향상을 보일 수 있는 새로운 듀얼(dual) TLB 구조와 운영 방법을 제안하고자 한다. 제안하는 듀얼 TLB 구조는 작은 페이지 크기( small page size)를 지원하는 완전 연관TLB와 큰 페이지 크기(large page size)를 지원하는 완전 연관TLB로 구성된다. 제시된 구조는 기존의 많은 엔트리 개수를 지원하는 TLB와의 성능 비교분석 결과를 통해 볼 때, 작은 엔트리 개수를 가지면서도 거의 같은 성능을 보임을 알 수 있다. 또한 동일 한 TLB 면적 크기로 기존 방식의 접근 실패율을 90%정도 감소시키는 성능을 제시하였다.

  • PDF

홀로그래픽 저장장치에서 인접 페이지 간 간섭 모델링 (Modeling of the Inter-Page Interference on the Holographic Data Storage Systems)

  • 박동혁;이재진
    • 한국통신학회논문지
    • /
    • 제35권7C호
    • /
    • pp.581-586
    • /
    • 2010
  • 홀로그래픽 저장장치는 여러 장의 데이터 페이지가 멀티플랙싱 기법에 의하여 같은 공간에 저장된다. 그러나 이러한 데이터 저장 밀도의 증가에 따라 페이지 데이터들이 서로에게 간섭이 된다. 같은 공간에 저장되는 모든 페이지들이 서로 간섭을 주게 되며, 그에 대한 영향력을 실험 과정에서 고려해야 한다. 따라서 본 논문에서는 이러한 페이지 간의 간섭에 대한 모델링을 하며, 그에 대한 성능을 분석한다.

콘텐츠 적응화 시스템에 SOP(Shared Object Page)를 도입한 개선된 캐싱 기법 (An Enhancing Caching Technique by the SOP(Shared Object Page) for Content Adaptation Systems)

  • 장서영;정호영;강수용;차재혁
    • 디지털콘텐츠학회 논문지
    • /
    • 제8권1호
    • /
    • pp.41-50
    • /
    • 2007
  • 오늘날 우리는 인터넷에 연결된 PC뿐만 아니라, 이동형 기기인 휴대전화, 무선 인터넷을 이용하는 PDA, 노트북, 그리고 D-TV 등을 통해서도 웹서버에 접근하여 콘텐츠 형태의 정보를 얻고 있다. 본 연구에서는 이러한 환경을 지원하기 위하여 각각의 적응화된 컨텐츠를 저장하는 것을 기반으로 하며, 이를 다양한 기기를 지닌 사용자에게 활용하기 위해 페이지 정보를 지니는 메타 데이터를 적용하는 웹 캐싱 기법(SOP)를 제안한다.

  • PDF

NAND 플래시 변환 계층에서 전력 소모에 영향을 미치는 페이지 캐싱 전략의 비교·분석 (A Comparative Analysis on Page Caching Strategies Affecting Energy Consumption in the NAND Flash Translation Layer)

  • 이형봉;정태윤
    • 대한임베디드공학회논문지
    • /
    • 제13권3호
    • /
    • pp.109-116
    • /
    • 2018
  • SSDs that are not allowed in-place update within the allocated page cause another allocation of a new page that will replace the previous page at the moment data modification occurs. This intrinsic characteristic of SSDs requires many changes to the existing HDD-based IO theory. In this paper, we conduct a performance comparison of FTL caching strategy in perspective of cache hashing (Global vs. grouped) and caching algorithm (LRU vs. NUR) through a simulation. Experimental results show that in terms of energy consumption for flash operation the grouped management of cache is not suitable and NUR algorithm is superior to LRU algorithm. In particular, we found that the cache hit ratio of LRU algorithm is about 10% point higher than that of NUR algorithm while the energy consumption of LRU algorithm is about 32% high.

Gradient 2-D PAGE를 이용한 양수 프로테옴 분석 (Proteome Analysis of Amniotic Fluid by gradient 2-D PAGI)

  • 이은희;김재찬;변상요
    • KSBB Journal
    • /
    • 제18권1호
    • /
    • pp.35-38
    • /
    • 2003
  • 양수 내에 존재하는 총 단백질을 이차원 전기영동을 이용하여 분리 분석하였고, gradient gel을 이용하여 양수 내에 소량으로 존재하는 미세 단백질까지 분리하였다. 양수 내에는 고농도로 존재하는 단백질이 있는데 이것이 serum albumin precursor임을 확인하였고, 8-18% gradient gel의 이용으로 분해능(resolution)이 향상되어 미세 단백질을 분리 분석할 수 있었다. 이차원 전기영동 후 MALDI-TOF를 이용하여 단백질을 identification하여 기존의 양수 protein database에 존재하는 단백질을 확인하였고, 존재하지 않는 새로운 단백질을 분리 분석하였다.

웹 페이지에서 참조무결성 제약조건에 관한 연구 (A Study on Referential Integrity Constraint on Web Page)

  • 유남현;손철수;김원중
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2004년도 춘계종합학술대회
    • /
    • pp.569-572
    • /
    • 2004
  • 다수의 사람들이 관리ㆍ운영하는 많은 분량의 HTML 문서들로 이루어진 웹사이트들의 경우에는 현수참조(Dangling Reference)와 오문참조(Inaccurate Contents Reference)와 같은 깨진 링크(Broken Link)를 관리하는데 많은 어려움이 따른다. 즉, HTML 페이지의 내용 중 연결구조에 관련된 부분을 변경하거나 삭제하는 경우 문서들간의 연결구조에 대한 무결성(Integrity)을 보장하기가 어렵다. 본 논문에서는 Parent 페이지와 Child 페이지에서의 무결성 제약조건(Integrity Constraint Condition)들을 조사하여 정의하고, 확장 UML로 표현하는 방법에 대해 연구하였다.

  • PDF

Development of Flash Memory Page Management Techniques

  • Kim, Jeong-Joon
    • Journal of Information Processing Systems
    • /
    • 제14권3호
    • /
    • pp.631-644
    • /
    • 2018
  • Many studies on flash memory-based buffer replacement algorithms that consider the characteristics of flash memory have recently been developed. Conventional flash memory-based buffer replacement algorithms have the disadvantage that the operation speed slows down, because only the reference is checked when selecting a replacement target page and either the reference count is not considered, or when the reference time is considered, the elapsed time is considered. Therefore, this paper seeks to solve the problem of conventional flash memory-based buffer replacement algorithm by dividing pages into groups and considering the reference frequency and reference time when selecting the replacement target page. In addition, because flash memory has a limited lifespan, candidates for replacement pages are selected based on the number of deletions.

특허 인용 네트워크 분석 (Patent citation network analysis)

  • 이민정;김용대;장원철
    • 응용통계연구
    • /
    • 제29권4호
    • /
    • pp.613-625
    • /
    • 2016
  • 과학 기술의 발전은 사회를 급격하게 변화시켜 왔다. 특허 자료 분석은 현대 과학 기술의 흐름을 이해하고 미래 유망기술을 예측할 수 있게 한다. 본 연구에서는 기술의 동향을 파악하고자 1985년과 2012년 사이에 미국 특허청에 등록된 특허를 중심으로 특허 인용 네트워크를 분석한다. 주요 기술군을 파악하기 위해 PageRank 알고리즘 외에 다양한 중심성 지표를 이용하고, 통계적 네트워크 모형을 통해 유사한 기술들의 군집을 찾아내고자 한다.

A Scheme to Interpret a JSP Page Using a New Concept of Scopes in Web Environment

  • Chung, Yongju;Song, Dooheon
    • 한국멀티미디어학회논문지
    • /
    • 제7권6호
    • /
    • pp.851-857
    • /
    • 2004
  • Server-side scripting languages for web applications have a different environment from general programming languages. The reason is that some data in web applications should be transferred to a distinct file of a page or should be maintained for a physical time, that is for session time. SO JSP has four kinds of new scopes such as page, request, session, application. And every identifiers in JSP are classified and processed as one of the four scopes. This seems unavoidable to a scripting language because of the web environment. So when a JSP page using these new scope concepts is interpreted the procedure would be different from that of the general programming language's scopes. This thesis has studied the processing of the scopes which are considered in interpreting a script language code. This processing method of the scopes in this article can be applied not only to JSP interpreting but also to a data processing of similar ranges in web.

  • PDF