• 제목/요약/키워드: Semistructured Data

검색결과 34건 처리시간 0.026초

HTML 태그페턴을 이용한 웹정보추출시스템 (Web Information Extraction using HTML Tag Pattern)

  • 박병권
    • 한국정보시스템학회:학술대회논문집
    • /
    • 한국정보시스템학회 2005년도 춘계학술대회 발표 논문집
    • /
    • pp.79-92
    • /
    • 2005
  • To query the vast amount of web pages which are available i]l the Internet, it is necessary to extract the encoded information in the web pages for converting it into structured data (e.g. relational data for SQL) or semistructured data (e.g. XML data for XQuery), In this paper, we propose a new web information extraction system, PIES, to convert web information into XML documents. PIES is based on a user-specified target schema and HTML tag pattern descriptions. The web information is extracted by the pattern descriptions and validated by the target schema. We designed a new language to describe extraction rules, and a new regular expression to describe HTML tag patterns. We implemented PIES and applied it to the US patent web site to evaluate its correctness. It successfully extracted more than thousands of US patent data and converted them into XML documents.

  • PDF

반구조적 데이터의 효율적인 최소경계 스키마 추출 기법 (An Efficient Technique for Extracting Lower Bound Schema from Semistructured Data)

  • 박경현;김록원;양은주;최은선;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.27-29
    • /
    • 2000
  • 반구조적 데이터는 기존의 스키마와는 달리 고정된 스키마가 없고 주어진 데이터 인스턴스에 대해 하나 이상의 스키마가 존재한다. 따라서 여러 개의 스키마 추출이 가능한데 그중 가장 정확한 스키마를 추출해야 하는 문제(S초듬 Fxtraction)가 발생한다. 이러한 문제를 해결하기 위해 지금까지 여러 가지 스키마 추출 기번들이 제안되었는데 대표적인 것으로 데이터가이드(DataGuide)를 이용하여 최대경계 스키마를 추출하는 방법과 데이터로그(DataLog)를 이용하여 최소경계 스키마를 추출하는 방법이 있다. 이 논문에서는 기존의 데이터로그를 이용하는 방법보다 최소경계 스키마 추출 기법을 제안하고 이전의 스키마 추출 기법들과 비교함으로써 알고리즘의 성능을 살펴본다.

  • PDF

다중 정규 경로 질의 처리를 위한 효율적 기법 (An Efficient Technique for Evaluating Queries with Multiple Regular Path Expressions)

  • 정태선;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권3호
    • /
    • pp.449-457
    • /
    • 2001
  • 최근에 XML이 웹 상에서 문서 교환의 표준으로 등장하면서 XML로 표현된 데이터에 대한 질의 처리 분야가 주목받고 있다. 이때 XML 질의는 그래프로 표현된 데이터 그래프에서 특정 정규식으로 도달되는 객체를 찾는 정규 경로 질의 (regular path query)를 기반으로 한다. 그런데 사용자의 다양한 형태의 질의를 처리하기 위해서는 질의에 하나 이상의 정규 식을 가지는 질의의 처리가 필요함에도 기존의 연구 즉, 비정형 데이터 모델 하에서의 부를 이용한 질의 변환(query rewriting)이나, 질의 최적화 기법에서는 주로 단일 정규식으로 이 루어진 질의를 다루었다. 본 논문에서는 이러한 다중 정규식을 가지는 질의의 처리에서 1. 뷰의 몸체에서 질의 몸체로의 변수 매핑을 통한 질의 변환과정과 2. 변환된 질의의 각 조각 (conjunct)의 질의 결과를 효율적으로 구하고 결과를 조합하는 두 단계로 이루어진 효율적 인 질의 처리 기법을 제안한다. 제안하는 질의 변환 알고리즘이 안전성(soundness)을 가짐 을 보이고, 질의 처리 기법이 기존 질의 처리 방식에 비하여 효율적임을 보인다.

  • PDF

입원아동이 지각한 건강과 질병개념에 관한 연구 (A Study on Health/Illness Concepts in Hospitalized Children)

  • 성미혜
    • Child Health Nursing Research
    • /
    • 제7권2호
    • /
    • pp.149-160
    • /
    • 2001
  • The purpose of this study was to explore the health and illness concepts of hospitalized children. The subjects were 129 hospitalized children from 3 to 12 years old in one general hospital. Data were collected through semistructured interviews by authors. This study was conducted from Jun. 1, 2000 to Dec. 31, 2000. Data were coded and categorized by content analysis. The results were as follows : 1. Perceived health concept were physical well-being, food, exercise, powerfulness, emotional stability, obeidence, cleanliness, sleep and ability of social adaptation. 2. Perceived health behavior to maintain health were food, treatment, exercise, cleanliness, obeidence, sleep, emotional stability, power-fulness and psychological stability, physical well-being. 3. Perceived prevention of illness were food, cleanliness, treatment, exercise, obedience, sleep, powerfulness, psychological stability, emotional stability, recreation and ability of social adaptation. 4. Perceived causes of illness were illness, trauma and food. 5. Perceived treatment of illness were treatment, sleep, rest, food, obedience, emotional stability, psychological stability, cleanliness, exercise and powerfulness.

  • PDF

XML 데이타를 위한 효율적인 디스크 블록 할당 방법 (An Efficient Disk Block Allocation Method for XML Data)

  • 김정훈;손진현;정연돈;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권5호
    • /
    • pp.465-472
    • /
    • 2007
  • XML과 같은 준구조적 데이타가 많이 사용됨에 따라 이를 효과적으로 저장하고 관리하는 것이 중요해지고 있다. XML 데이타는 트리 형태로 모델링이 가능하며, 기본적으로 질의 처리는 트리를 탐색하는 방식으로 이루어진다. 본 논문에서는 XML 데이타를 디스크 블록에 저장하는 알고리즘을 제안한다. 제안하는 알고리즘은 트리의 각 노드마다 아래쪽에서 위쪽으로 숫자를 할당하며 그 숫자를 이용하여 디스크 블록에 노드들을 매핑한다. 제안하는 알고리즘은 접근 패턴 정보를 필요로 하지 않으며 어떠한 접근 패턴에 대해서도 좋은 성능을 보인다. 제안하는 방법의 몇가지 특성을 증명하고, 실험을 통해서 성능을 평가한다.

3세대 모녀간의 애착.자율성 발달특성과 심리적 적응 (Three generations of mothers and daughters: attachment patterns and psychological well-being)

  • 유은희
    • 가정과삶의질연구
    • /
    • 제14권4호
    • /
    • pp.191-202
    • /
    • 1996
  • This research applied an attachment theory to the study of three generations of women. Questionnaire and semistructured interview techniques were employed to collect the data on intergenerational mother-daughter relationships from 140 triads of adolescent daughters middle-aged mothers an old-aged grandmothers. The focus of the study had been on the characteristics of attachment patterns which is measured by sense of attachment and autonomy across and within generations and their effects on personal well-being. Women in each their three generations perceived a high and seminilar level of attachment across and within the generations. On the other hand the level of autonomy differed by the generations with middle-aged mothers showing a higher level of perceived sense of autonomy than other two generations. Although the levels of attachment and autonomy were related to psychological well-being the level of autonomy was slightly more related to it. The results also showed that not nly one's own attachment toward mother/daughter but attachment of others toward herself were associated with the personal well-being. Overall this study reflects and supports the basis concepts of mother-daughter attachment: its continuity reciprocity and personal development in adulthood.

  • PDF

ORDBMS를 이용한 XML문서의 저장 및 질의 (Storing and Querying XML Data using ORDBBM)

  • 박성희;박경현;김록원;남광우;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.81-83
    • /
    • 2000
  • 현재 XML 문서를 저장하고 이에 대한 질의를 처리하는 백엔드 저장소로써는 파일시스템, 기존의 RDBMS와 OODBMS를 이용하는 접근 방법이 있다. 또한 독자적으로 semistrucured 데이터에 대한 저장 및 질의를 처리 할 수 있는 데이터베이스 시스템이 존재한다. 따라서, 이 논문에서는 기존의 응용프로그램에서 이용하는 데이터와 통합을 잘 할 수 있는 RDBMS의 장점과 객체지향 DOM모델을 지원할 수 있는 OODBMS의 특징을 모두 수용할 수 있는 ORDBMS에서 XML 문서를 저장하고 저장된 데이터에 대한 질의를 잘 할 수 있는 XML문서 처리시스템을 설계한다. 여기서, XML문서의 논리적 구조가 정해져 있지 않는 XML문서를 ORDBMS의 테이블 형태로 저장하는 여러 가지 방법을 제시하고, semistructured 데이터에 대한 질의의 특징인 패스표현을 효율적으로 지원하기 위해 패스 인덱스의 개념을 제시한다. 이렇게 함으로써 XML문서에 대한 질의를 ORDBMS에서 처리할 때 효율성을 높일 수 있다.

  • PDF

Mystery Shopping and Well-Being of Service Workers in South Korea

  • Shin, Heeju
    • Safety and Health at Work
    • /
    • 제10권4호
    • /
    • pp.476-481
    • /
    • 2019
  • Background: Mystery shopping is a method in which a company monitors quality of service and employee conduct and compliance with regulations using an evaluator posing as a customer. It is a typical tool of customer-centered bureaucratic control insofar as it provides overall and standardized evaluation of intangible elements of customer service as well as physical elements of service environments. The purpose of this study is to examine how mystery shopping is related to the health status of service workers in South Korea. Methods: Data from semistructured interviews with 15 workers were collected from January to April 2019 to obtain information on service worker experiences with mystery shopping. Data were analyzed using the constant comparison method. Results: Mystery shopping limits worker autonomy and stiffens the workplace environment by standardizing and monitoring labor processes for service workers. In addition, mystery shopping heightens work stress through increased labor intensity. Five mechanisms by which mystery shopping affects service worker health are identified and comprise (1) multifaceted and multilayered surveillance, (2) evaluator subjectivity and irrational requirements, (3) standardized rules combined with high pressure to achieve sales, (4) self-esteem degradation because of evaluator results, and (5) musculoskeletal disorders because of strict adherence to labor processes based on evaluator results. Conclusion: Mystery shopping as an evaluation method should be reconsidered not only in terms of health problems but also in terms of organizational efficiency and issues of human rights.

학령전기 입원 아동의 건강 및 질병 개념에 관한 연구 (A study on Health/Illness concepts in Hospitalized Preschoolers)

  • 성미혜
    • Child Health Nursing Research
    • /
    • 제6권3호
    • /
    • pp.291-304
    • /
    • 2000
  • The purpose of this study was to explore the health and illness concepts of hospitalized preschoolers. The subjects were 52 hospitalized preschoolers from 3 to 6 grade in one general hospital. Data were collected through semistructured interviews by author. this study was conducted from Mar 2, 2000 to Jun. 30, 2000. Data were coded and categorized by content analysis. The results were as follows : 1. Hospitalized preschoolers's answers about health concepts were coded and then classificated to 7 categories(physical well-being, food, powerfulness, exercise, obedience to authority, cleanliness, sleep.) 2. Hospitalized preschoolers's answers about health behavior to maintenance health were coded and then classificated to 8 categories (food, obedience to authority, treatment, exercise, cleanliness, powerfulness, sleep, psychological stability). 3. Hospitalized preschoolers's answers about prevention of illness were coded and then classificated to 9 categories(food, treatment, obedience to authority, powerfulness, emotional stability, psychological stability, exercise, physical well-being, ability of social adaption). 4. Hospitalized preschoolers's answers about cause of illness were coded and then classificated to 3 categories(illness, trauma, food). 5. Hospitalized preschoolers's answers about treatments of illness were coded and then classificated to 9 categories(treatment, rest, emotional stability, sleep, psychological stability, food, obedience, exercise, powerfulness). 6. The levels of health and illness concepts in this sample were higher than those of the physical causality.

  • PDF

과학기술분야 출연연구기관 연구데이터 관리 및 공유 사례 분석 연구 (A Study on the analysis of Research Data Management and Sharing of Science & Technology Government-funded Research Institutes)

  • 박미영;안인자;남승주
    • 한국비블리아학회지
    • /
    • 제29권4호
    • /
    • pp.319-344
    • /
    • 2018
  • 본 연구에서는 오픈사이언스 정책의 일환으로 학문분야별 연구데이터 공유 활용에 관한 인식을 비교분석하였다. 이를 기반으로 과학기술분야 정부출연연구기관 27개 기관 데이터 업무담당자를 대상으로 반구조화된 질문을 통하여 심층인터뷰를 실시하였다. 그 중 데이터 관리 면에서 우수기관 9개 기관을 선정하여 연구데이터 수집 및 관리현황 사례를 구체적으로 제시하였다. 결과 현재 출연연구기관의 연구데이터 수집 관리는 전반적으로 시범사업 단계이며, 데이터의 수집 구축 수준 또한 기관별로 상이하다. 기관별로 살펴보면 수집을 시작하는 단계(KIOM), 수집 관리가 고도화되고 있는 단계(KIST), 공유 활용을 시작하는 단계(KRIBB, KRICT) 등으로 구분된다.