Genel Bilgi
Kod | CENG0046 |
Ad | Text Vectorization |
Dönem | 2023-2024 Eğitim-Öğretim Yılı |
Yarıyıl | . Yarıyıl |
Süre (T+U) | 3-0 (T-U) (17 Hafta) |
AKTS | 6 AKTS |
Yerel Kredi | 3 Yerel Kredi |
Eğitim Dil | İngilizce |
Seviye | Doktora Dersi |
Tür | Normal |
Öğretim Şekli | Yüz Yüze Öğretim |
Bilgi Paketi Koordinatörü | Prof. Dr. UMUT ORHAN |
Dersin Amacı / Hedefi
Öğrenci kelime, cümle ve dökümanların sayısal olarak temsilini sağlayan metin vektörleşme yöntemlerini öğrenerek derin öğrenmeye dayalı doğal dil işleme problemlerinde başarının artmasını sağlar. Tüm bu süreçte bağlamın önemini ve seyrekliği düşük hesaplama yöntemlerine odaklanmayı öğrenir.
Dersin İçeriği
Vector Space Model and One-hot vectors, Sense Representation Problem and Synset Embedding, Sparsity Problem, Word Embedding Methods (Word2Vec, Glove, FastText), Contextualized Text Embeddings (BERT, ELMO, GPT-x), Synset Based Contextual Embedding (Generalized SemSpace)
Dersin Ön Koşulu
yok
Kaynaklar
State of the art papers
Notlar
Daniel Jurafsky and James H. Martin, Speech and language processing an introduction to natural language processing, computational linguistics, and speech, 2000.
Dersin Öğrenme Çıktıları
Sıra | Dersin Öğrenme Çıktıları |
---|---|
ÖÇ01 | Kelime ve anlam gömme kavramlarını öğrenir |
ÖÇ02 | Bağlamsallaştırmayı anlar |
ÖÇ03 | Metin temsilinin yararlarını yorumlar |
ÖÇ04 | En yeni teknolojik yöntemleri metinlere uygular |
Program Öğrenme Çıktıları ile İlişkisi
Sıra | Tür | Program Öğrenme Çıktıları | Duzey |
---|---|---|---|
PÖÇ01 | Bilgi - Kuramsal, Olgusal | Lisans düzeyinde kazanılan yetkinlikler temelinde Bilgisayar Mühendisliği temel alanında özgün çalışmalar için gerekli temeli sağlayan ileri düzeyde bilgi ve kavrayışa sahiptir. | 3 |
PÖÇ02 | Bilgi - Kuramsal, Olgusal | Mühendislik alanında bilimsel araştırma yaparak bilgiye genişlemesine ve derinlemesine ulaşır, bilgiyi değerlendirir, yorumlar ve uygular. | 3 |
PÖÇ03 | Yetkinlikler - Öğrenme Yetkinliği | Mesleğinin yeni ve gelişmekte olan uygulamalarının farkında olup, gerektiğinde bunları inceler ve öğrenir. | 2 |
PÖÇ04 | Yetkinlikler - Öğrenme Yetkinliği | Mühendislik problemlerini kurgular, çözmek için yöntem geliştirir ve çözümlerde yenilikçi yöntemler uygular. | 4 |
PÖÇ05 | Yetkinlikler - Öğrenme Yetkinliği | Analitik, modelleme ve deneysel esaslı araştırmaları tasarlar ve uygular, bu süreçte karşılaşılan karmaşık durumları çözümler ve yorumlar. | |
PÖÇ06 | Yetkinlikler - Öğrenme Yetkinliği | Yeni ve/veya özgün fikir ve yöntemler geliştirir, sistem, parça veya süreç tasarımlarında yenilikçi çözümler geliştirir. | 4 |
PÖÇ07 | Beceriler - Bilişsel, Uygulamalı | Öğrenme becerilerine sahip olur. | 3 |
PÖÇ08 | Beceriler - Bilişsel, Uygulamalı | Bilgisayar Mühendisliğinin yeni ve gelişmekte olan uygulamalarının farkında olup gerektiğinde bunları inceler ve öğrenir. | 2 |
PÖÇ09 | Beceriler - Bilişsel, Uygulamalı | Çalışmalarının süreç ve sonuçlarını Bilgisayar Mühendisliği alanındaki veya alan dışındaki ulusal ve uluslararası ortamlarda açık bir şekilde yazılı veya sözlü olarak aktarır. | 3 |
PÖÇ10 | Beceriler - Bilişsel, Uygulamalı | Bilgisayar Mühendisliğinde uygulanan güncel teknik ve yöntemler ile bunların kısıtları hakkında kapsamlı bilgiye sahip olur. | 4 |
PÖÇ11 | Beceriler - Bilişsel, Uygulamalı | Bilgisayar Mühendisliğinin gerektirdiği düzeyde bilgisayar yazılımı ile birlikte bilişim ve iletişim teknolojilerini ileri düzeyde etkileşimli olarak kullanır. | 4 |
PÖÇ12 | Bilgi - Kuramsal, Olgusal | Mesleki tüm etkinliklerde toplumsal, bilimsel ve etik değerleri gözetir. |
Haftalık Akış
Hafta | Konu | Ön Hazırlık | Yöntemler |
---|---|---|---|
1 | Vector Space Model | Makale okuma | Öğretim Yöntemleri: Anlatım |
2 | One-hot vectors | Makale okuma | Öğretim Yöntemleri: Anlatım |
3 | Word-Sense Representation Problem | Makale okuma | Öğretim Yöntemleri: Anlatım |
4 | Word-Synset Embedding | Makale okuma | Öğretim Yöntemleri: Anlatım |
5 | Sparsity Problem | Makale okuma | Öğretim Yöntemleri: Anlatım |
6 | Word Embedding Apps (Word2Vec, Glove, FastText) | Makale okuma | Öğretim Yöntemleri: Deney / Laboratuvar |
7 | Contextualized Text Embeddings | Makale okuma | Öğretim Yöntemleri: Anlatım |
8 | Ara Sınavlar | Tüm ders notlarını okumak | Ölçme Yöntemleri: Yazılı Sınav |
9 | Contextualized Apps (BERT, ELMO, GPT-x) | Makale okuma | Öğretim Yöntemleri: Deney / Laboratuvar |
10 | Synset Based Contextual Embedding (Generalized SemSpace) | Makale okuma | Öğretim Yöntemleri: Anlatım |
11 | Projects 1 | Proje hazırlamak | Ölçme Yöntemleri: Proje / Tasarım |
12 | Projects 2 | Proje hazırlamak | Ölçme Yöntemleri: Proje / Tasarım |
13 | Projects 3 | Proje hazırlamak | Ölçme Yöntemleri: Proje / Tasarım |
14 | Projects 4 | Proje hazırlamak | Ölçme Yöntemleri: Proje / Tasarım |
15 | Projects 5 | Proje hazırlamak | Ölçme Yöntemleri: Proje / Tasarım |
16 | Yarıyıl Sonu Sınavları | Tüm ders notlarını okumak | Ölçme Yöntemleri: Yazılı Sınav |
17 | Yarıyıl Sonu Sınavları | Tüm ders notlarını okumak | Ölçme Yöntemleri: Yazılı Sınav |
Öğrenci İş Yükü - AKTS
Çalışmalar | Sayısı | Süresi (Saat) | İş Yükü (Saat) |
---|---|---|---|
Ders ile İlgili Çalışmalar | |||
Ders (Sınav haftaları dahil değildir) | 14 | 3 | 42 |
Sınıf Dışı Ders Çalışma (Ön çalışma, pekiştirme) | 14 | 2 | 28 |
Değerlendirmeler ile İlgili Çalışmalar | |||
Ödev, Proje, Diğer | 3 | 15 | 45 |
Ara Sınavlar (Yazılı, Sözlü, vs.) | 1 | 15 | 15 |
Yarıyıl/Yıl Sonu/Final Sınavı | 1 | 15 | 15 |
Toplam İş Yükü (Saat) | 145 | ||
Toplam İş Yükü / 25 (s) | 5,80 | ||
AKTS | 6 AKTS |