rob-steal-parallel-corpora

Repository kode pemrograman R dan data untuk analisis dalam penelitian dengan judul MODEL KAJIAN TERJEMAHAN BERBASIS BANK DATA TERJEMAHAN DIGITAL INGGRIS-INDONESIA DAN IMPLIKASI PEDAGOGISNYA

https://github.com/gederajeg/rob-steal-parallel-corpora

Science Score: 44.0%

This score indicates how likely this project is to be science-related based on various indicators:

  • CITATION.cff file
    Found CITATION.cff file
  • codemeta.json file
    Found codemeta.json file
  • .zenodo.json file
  • DOI references
    Found 7 DOI reference(s) in README
  • Academic publication links
  • Academic email domains
  • Institutional organization owner
  • JOSS paper metadata
  • Scientific vocabulary similarity
    Low similarity (9.7%) to scientific vocabulary

Keywords

construction-grammar constructional-equivalence corpus-linguistics english-indonesian-parallel-corpora english-indonesian-translation opensubtitle parallel-corpora rob-steal-synonyms subtitle-corpora udayana-university
Last synced: 6 months ago · JSON representation ·

Repository

Repository kode pemrograman R dan data untuk analisis dalam penelitian dengan judul MODEL KAJIAN TERJEMAHAN BERBASIS BANK DATA TERJEMAHAN DIGITAL INGGRIS-INDONESIA DAN IMPLIKASI PEDAGOGISNYA

Statistics
  • Stars: 0
  • Watchers: 1
  • Forks: 0
  • Open Issues: 0
  • Releases: 0
Topics
construction-grammar constructional-equivalence corpus-linguistics english-indonesian-parallel-corpora english-indonesian-translation opensubtitle parallel-corpora rob-steal-synonyms subtitle-corpora udayana-university
Created over 4 years ago · Last pushed about 4 years ago
Metadata Files
Readme License Citation

README.Rmd

---
output: github_document
title: "Repositori data dan kode pemrograman untuk Penelitian Unggulan Program Studi (PUPS) dengan judul *MODEL KAJIAN TERJEMAHAN BERBASIS BANK DATA TERJEMAHAN DIGITAL INGGRIS-INDONESIA DAN IMPLIKASI PEDAGOGISNYA*"
author: '[Gede Primahadi Wijaya Rajeg](https://udayananetworking.unud.ac.id/lecturer/880-gede-primahadi-wijaya-rajeg) ORCID iD icon(Ketua Tim Peneliti), [I Made Rajeg](https://udayananetworking.unud.ac.id/lecturer/1817-i-made-rajeg) ORCID iD icon(Anggota), I Gede Semara Dharma Putra (Anggota Mahasiswa), Putu Dea Indah Kartini (Anggota Mahasiswa)'
bibliography: "references.bib"
link-citations: yes
csl: "linguistics.csl"
---



```{r, include = FALSE}
knitr::opts_chunk$set(
  collapse = TRUE,
  comment = "#>"
)
```

Universitas Udayana, Bali, Indonesia

Creative Commons License [![](https://img.shields.io/badge/doi-10.17605/OSF.IO/Y6ESA-lightblue.svg)](https://doi.org/10.17605/OSF.IO/Y6ESA)
Semua berkas di dalam repositori ini berlisensi Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License. Kunjungi [laman utama](https://udayananetworking.unud.ac.id/lecturer/research/880-gede-primahadi-wijaya-rajeg/a-model-for-translation-study-based-on-english-indonesian-translation-database-and-its-pedagogical-implication-1179) penelitian ini. Jika berkas-berkas dalam repositori ini [@rajeg_material_2021] digunakan untuk tujuan penelitian dan pengajaran, harap menyitir/mengutip repositori ini sebagai berikut: > Rajeg, Gede Primahadi Wijaya, I Made Rajeg, Putu Dea Indah Kartini & I Gede Semara Dharma Putra. 2021. Material pendukung untuk *MODEL KAJIAN TERJEMAHAN BERBASIS BANK DATA TERJEMAHAN DIGITAL INGGRIS-INDONESIA DAN IMPLIKASI PEDAGOGISNYA*. Open Science Framework. https://doi.org/10.17605/OSF.IO/Y6ESA. https://osf.io/y6esa/. Luaran utama dari penelitian ini, yaitu artikel jurnal, saat ini sedang dalam proses peninjauan sejawat (*peer review*), dan repositori pendukung artikel tersebut dapat diakses melalui [tautan berikut](https://github.com/gederajeg/constructional-equivalence) [@Rajeg_Constructional_equivalence_in_2021]. # Material - Direktori [SENASTEK](https://github.com/gederajeg/rob-steal-parallel-corpora/tree/main/SENASTEK) berisi berkas pendukung untuk makalah yang disajikan pada [*Seminar Nasional Sains, Teknologi dan Humaniora*](https://senastek.unud.ac.id) 2021 (SENASTEK 2021). Berkas-berkas tersebut berupa data mentah, [kode pemrograman R](https://github.com/gederajeg/rob-steal-parallel-corpora/blob/main/SENASTEK/SENASTEK-code.R) untuk analisis kuantitatif dan visualisasi, [salindia/slides](https://doi.org/10.6084/m9.figshare.17078369) dan [abstrak](https://github.com/gederajeg/rob-steal-parallel-corpora/blob/main/SENASTEK/SENASTEK-abstrak.pdf) presentasi [@rajeg_pemanfaatan_2021], dan dua grafik statistik yang digunakan dalam presentasi. - Direktori [LITERATES](https://github.com/gederajeg/rob-steal-parallel-corpora/tree/main/LITERATES) berisi berkas pendukung untuk makalah pada *LINGUISTICS, LITERATURE, CULTURE AND ARTS INTERNATIONAL SEMINAR* ([LITERATES](https://fba.unmas.ac.id/literates/)) yang diselenggarakan pada tanggal 22 Januari 2022 oleh [Fakultas Bahasa Asing](https://fba.unmas.ac.id) (FBA), Universitas Mahasaraswati Denpasar. - Berkas [`gpwr2021-code-for-pre-processing-the-osub-tmx-file.R`](https://github.com/gederajeg/rob-steal-parallel-corpora/blob/main/gpwr2021-code-for-pre-processing-the-osub-tmx-file.R) mengandung kode pemrograman untuk pengolahan awal korpus paralel Inggris-Indonesia *OpenSubtitles2018* [@lison_opensubtitles2016_2016] berformat `.tmx`. Pengolahan ini adalah untuk memisahkan kalimat bahasa Inggris dan padanan bahasa Indonesianya menjadi dua berkas teks biasa (`.txt`) terpisah, yang kemudian bisa menjadi input untuk konkordansi paralel (lihat info selanjutnya). - Berkas bernama [`ROB_sample_conc_main.tsv`](https://github.com/gederajeg/rob-steal-parallel-corpora/blob/main/ROB_sample_conc_main.tsv) dan [`STEAL_sample_conc_main.tsv`](https://github.com/gederajeg/rob-steal-parallel-corpora/blob/main/STEAL_sample_conc_main.tsv) adalah data utama penelitian ini. Berkas ini berupa sampel konkordansi lema ROB dan STEAL beserta terjemahan bahasa Indonesianya yang telah dianotasi berdasarkan variabel-variabel kualitatif (leksikal, morfosintaksis, semantik, dan konstruksional) sesuai dengan tujuan dan rumusan masalah penelitian. - Program untuk menghasilkan konkordansi paralel menggunakan R dikemas dalam fungsi `para_conc()` yang diterbitkan bersama dengan modul pemrograman R bernama [**paracorp**](https://gederajeg.github.io/paracorp/) [@rajeg_paracorp_2021]. Perhatikan salah satu contoh penggunaan `para_conc()` berikut. Info lengkap cara memasang dan mengutip modul **paracorp** dalam publikasi dapat dilihat pada laman [**paracorp**](https://gederajeg.github.io/paracorp/). ```{r contoh-paraconc} # load the paracorp R package # more info at https://gederajeg.github.io/paracorp/ library(paracorp) # in this example, the English text is used as the source text my_para_conc <- para_conc(source_text = sci_en, target_text = sci_id, pattern = "\\bshould\\b", # regular expression pattern conc_sample = 20) # retrieve 20 random concordance lines # peek into the results as tibble/data frame head(my_para_conc) ``` # Sesi ruang kerja R ```{r sessinfo} devtools::session_info() ``` # Referensi

Owner

  • Name: Gede Primahadi Wijaya Rajeg
  • Login: gederajeg
  • Kind: user
  • Location: Bali, Indonesia
  • Company: Universitas Udayana

I am interested in cognitive linguistics, corpus linguistics, and construction grammar. I use R for all things data science in linguistics.

Citation (CITATION.cff)

cff-version: 1.2.0
message: "If you use materials and data from this repository, please cite them as below."
authors:
  - family-names: Rajeg
    given-names: Gede Primahadi Wijaya
    orcid: https://orcid.org/0000-0002-2047-8621
  - family-names: Rajeg
    given-names: I Made
  - family-names: Kartini
    given-names: Putu Dea Indah
  - family-names: Putra
    given-names: I Gede Semara Dharma
title: "Repositori data dan kode pemrograman untuk Penelitian Unggulan Program Studi (PUPS) dengan judul MODEL KAJIAN TERJEMAHAN BERBASIS BANK DATA TERJEMAHAN DIGITAL INGGRIS-INDONESIA DAN IMPLIKASI PEDAGOGISNYA"
version: 0.0.1
doi: 10.17605/OSF.IO/Y6ESA
date-released: 2021-12-10
license: CC-BY-NC-SA
repository-code: "https://github.com/gederajeg/rob-steal-parallel-corpora"

GitHub Events

Total
Last Year

Issues and Pull Requests

Last synced: 11 months ago

All Time
  • Total issues: 0
  • Total pull requests: 0
  • Average time to close issues: N/A
  • Average time to close pull requests: N/A
  • Total issue authors: 0
  • Total pull request authors: 0
  • Average comments per issue: 0
  • Average comments per pull request: 0
  • Merged pull requests: 0
  • Bot issues: 0
  • Bot pull requests: 0
Past Year
  • Issues: 0
  • Pull requests: 0
  • Average time to close issues: N/A
  • Average time to close pull requests: N/A
  • Issue authors: 0
  • Pull request authors: 0
  • Average comments per issue: 0
  • Average comments per pull request: 0
  • Merged pull requests: 0
  • Bot issues: 0
  • Bot pull requests: 0
Top Authors
Issue Authors
Pull Request Authors
Top Labels
Issue Labels
Pull Request Labels