PENGANTAR TEKNOLOGI SISTEM
CERDAS
ARTIFICIAL INTELLIGENCE
DAN
NATURAL LANGUAGE PROCESSING
Oleh :
Nabila Shadrina (17114709)
Kelas :
3KA26
FAKULTAS ILMU KOMPUTER &
TEKNOLOGI INFORMASI
UNIVERSITAS GUNADARMA
2016
A. Artificial Intelligence
Artificial Intelligence atau
AI merupakan cabang ilmu komputer yang bertujuan untuk membuat sebuah aplikasi yang
mampu menirukan cara kerja otak manusia, dengan menerima input pengetahuan dari
pakar dalam bentuk fakta – fakta, teori, prosedur dan aturan, untuk kemudian
diterapkan dalam proses pemecahan masalah di berbagai bidang.
Referensi :
Suparman, 1991. Mengenal
Artificial Intelligence. Yogyakarta: Penerbit Andi Offset.
B. Kecerdasan Buatan vs Kecerdasan Alami
Kelebihan kecerdasan buatan :
- Lebih permanen.
- Memberikan kemudahan dalam duplikasi dan penyebaran.
- Relatif lebih murah dari kecerdasan alamiah.
- Konsisten dan teliti.
- Dapat didokumentasi.
- Dapat mengerjakan beberapa task lebih cepat dan lebih baik dibanding manusia.
Kelebihan kecerdasan alami :
- Bersifat lebih kreatif.
- Dapat melakukan proses pembelajaran secara langsung, sementara AI harus mendapatkan masukan berupa symbol dan representasi.
- Fokus yang luas sebagai referensi untuk pengambilan keputusan, sebaliknya AI menggunakan fokus yang sempit.
Referensi : Desiani,
Anita & Arhami, Muhammad, 2006. Konsep
Kecerdasan Buatan. Yogyakarta : Penerbit Andi Offset.
Sejarah Kecerdasan Buatan
- Cikal Bakal Kecerdasan Buatan (1943 – 1955)
- . . Lahirnya Kecerdasan Buatan (1956)
- .Awal Perkembangan Kecerdasan Buatan (1952-1969)
- .Perkembangan Kecerdasan Buatan Mulai Melambat (1966-1974)
- Sistem Berbasis Pengetahuan (1969-1979)
- .Kecerdasan Buatan Menjadi Sebuah Industri (1980-1988)
- .Kembalinya Jaringan Syaraf Tiruan (1986 – sekarang)
Referensi :Russell, Stuart & Norvig, Peter, 2003. Artificial Intelligence, A Modern Approach,
[online], (http://xgxy.cug.edu.cn/rjgcx/lzw/AI/AIMA-Second-Edition.pdf, diakses pada 9 Oktober 2016).
A. Konsep Dasar Artificial Intelligence
- Acting Humanly : Pendekatan Uji Turing
- Thinking Humanly : Pendekatan Model Kognitif
- Thinking Rationally : The Laws of Thought Approach
- Acting Rationally : The Rational Agent Approach
Referensi : Desiani,
Anita & Arhami, Muhammad, 2006. Konsep
Kecerdasan Buatan. Yogyakarta : Penerbit Andi Offset.
B. Disiplin Ilmu Artificial Intelligence
- Natural Languange Processing (NLP)
- Expert System (ES)
- Pattern Recognition (PR)
- Robotic
Referensi :
Abraham, David., Permana, Indra W., Nugraha, Rangga
A., Alvian, Moch. & Hanif, 2015. Penyelesaian
Masalah 8-Puzzle dengan Algoritma Steepest-Ascent Hill Climbing, [online], (http://jurnal.untirta.ac.id/index.php/jis/article/download/465/354, diakses pada 27 September 2016).
22 PEMROSESAN BAHASA ALAMI
Dua alasan utama
mengapa agen komputer kita ingin dapat memproses bahasa alami: untuk
berkomunikasi dengan manusia dan untuk memperoleh informasi dari bahasa
tertulis. Faktor umum dalam menangani tugas-tugas ini adalah penggunaan model bahasa: model yang memprediksi
distribusi probabilitas dari ekspresi bahasa.
22.1
MODEL BAHASA
Bahasa formal, seperti
bahasa pemrograman Java atau Python, telah tepat mendefinisikan model bahasa.
22.1.1
Model karakter N-gram
Sebuah teks tertulis
terdiri dari karakter. Dengan demikian, salah satu model bahasa yang paling
sederhana adalah distribusi probabilitas atas urutan karakter.
22.1.2
Merapikan Model n-gram
Komplikasi utama dari
model n-gram yaitu corpus pelatihan hanya menyediakan perkiraan distribusi
probabilitas benar.
22.1.3
Evaluasi Model
Dengan
begitu banyak kemungkinan n-gram model—unigram, bigram, trigram, interpolasi
smoothing dengan nilai yang berbeda dari l,
bagaimana kita tahu untuk memilih model apa? Kita dapat mengevaluasi model
dengan cross-validasi.
22.1.4 Model kata N-gram
Semua
mekanisme yang sama berlaku sama untuk model kata dan karakter. Perbedaan utama
adalah bahwa kosa kata—serangkaian
simbol yang membentuk korpus dan model—lebih besar.
22.2 KLASIFIKASI TEKS
Klasifikasi teks juga dikenal sebagai
kategorisasi. Identifikasi bahasa dan klasifikasi genre adalah contoh dari
klasifikasi teks, seperti analisis sentimen (mengelompokkan film atau produk
ulasan positif atau negatif) dan deteksi spam (mengelompokkan pesan email
sebagai spam atau tidak-spam).
22.2.1
Klasifikasi oleh kompresi data
Sebuah algoritma kompresi lossless
mengambil urutan simbol, mendeteksi pola yang diulang di dalamnya, dan menulis
deskripsi dari urutan yang lebih padat daripada yang asli.
22.3 PENGAMBILAN INFORMASI
Pengambilan informasi (IR) merupakan pencarian
informasi berupa dokumen-dokumen yang relevan dengan kebutuhan pengguna informasi sehingga
dapat memenuhi keinginan user.
22.3.1 Fungsi Penilaian IR
Fungsi penilaian atau Scroing Function berasal dari proyek Okapi
Stephen Robertson dan Karen Sparck Jones di London City College yang telah
digunakan dalam mesin pencarian atau search engine.
22.3.2 Sistem Evaluasi IR
Didalam evaluasi IR ini terdapat 3 level pengukuran,
diantaranya: Pemrosesan, Pencarian,
Kepuasan pemakai.
22.3.3
Penyempurnaan IR
Sebagai penyempurnaan
akhir, IR dapat
ditingkatkan dengan mempertimbangkan metadata-data di
luar teks dokumen.
22.3.4 Algoritma PageRank
PageRank adalah salah satu
ide-ide asli dua yang mengatur pencarian google dari mesin
telusuri Web lain ketika diperkenalkan pada tahun 1997. (Inovasi yang lain
adalah penggunaan jangkar teks untuk mengindeks halaman).
22.3.5
The HITS algorithm ( Algoritma HITS )
Algoritma HITS
(Hyperlink-Induced Topic Search algorithm), juga dikenal sebagai “Hub dan
Otoritas”, merupakan algoritma link-analisis berpengaruh lainnya. HITS berbeda
dengan PageRank dalam beberapa cara. Pertama HITS bergantung pada ukuran query:
HITS mengukur halaman berdasarkan query.
22.3.6
Question answering
Pencarian informasi
adalah tugas mencari dokumen yang relevan dengan query, di mana permintaan
mungkin menjadi pertanyaan, atau hanya area topik atau konsep.
22.4
INFORMATION EXTRACTION
Information extraction
adalah proses memperoleh pengetahuan dengan membaca sekilas teks dan mencari
kejadian dari kelas objek dan hubungan antara objek – objek.
22.4.1
Finite-state automata untuk ekstraksi informasi
Tipe paling sederhana
dari sistem ekstraksi informasi adalah sistem
ekstraksi berbasis atribut yang mengasumsikan keseluruhan teks mengacu pada
objek tunggal dan tugasnya adalah mengekstrak atribut-atribut objek tersebut.
22.4.2. Model Probabilistik Untuk Ekstraksi Informasi(Informasi Turunan)
Ketika ekstraksi informasi harus berusaha dari keramain atau bervariasi masukan, keadaan terbatas yang sederhana merupakan pendekatan yang kurang baik.
22.4.3
Bidang acak bersyarat untuk ekstraksi informasi
Masalah HMMs untuk tugas
ekstraksi informasi adalah bahwa mereka memodelkan banyak probabilitas.
22.4.4
Ekstraksi ontologi dari korporasi besar
Sebuah aplikasi yang
berbeda dari teknologi ekstraksi adalah membangun basis pengetahuan besar atau
ontologi fakta dari korpus.
22.4.5
Konstruksi template otomatis
Mengingat satu set pencocokan, skema template-generasi
sederhana dapat menemukan template untuk menjelaskan pencocokan.
22.4.6 Pembacaan mesin
Untuk membangun ontologi besar dengan banyak ribuan hubungan;
Kami ingin memiliki sistem ekstraksi tanpa masukan manusia apapun — sebuah
sistem yang bisa membaca sendiri dan membangun database-nya sendiri.