Jawaban singkat: Peningkatan resolusi AI bekerja dengan melatih model pada pasangan gambar beresolusi rendah dan tinggi, kemudian menggunakannya untuk memprediksi piksel tambahan yang tampak realistis selama peningkatan resolusi. Jika model telah melihat tekstur atau wajah yang serupa dalam pelatihan, ia dapat menambahkan detail yang meyakinkan; jika tidak, ia mungkin "menghalusinasi" artefak seperti lingkaran cahaya, kulit seperti lilin, atau kedipan pada video.
Poin-poin penting:
Prediksi : Model ini menghasilkan detail yang masuk akal, bukan rekonstruksi realitas yang dijamin.
Pilihan model : CNN cenderung lebih stabil; GAN dapat terlihat lebih tajam tetapi berisiko menciptakan fitur baru.
Pemeriksaan artefak : Perhatikan adanya halo, tekstur yang berulang, "hampir huruf", dan wajah yang tampak seperti plastik.
Stabilitas video : Gunakan metode temporal, jika tidak, Anda akan melihat kedipan dan pergeseran antar bingkai.
Penggunaan berisiko tinggi : Jika akurasi penting, ungkapkan proses pengolahan data dan anggap hasilnya sebagai ilustrasi.

Anda mungkin pernah melihatnya: gambar kecil dan buram berubah menjadi gambar yang cukup jernih untuk dicetak, diputar, atau dimasukkan ke dalam presentasi tanpa perlu khawatir. Rasanya seperti curang. Dan—dalam arti yang terbaik—memang agak seperti itu 😅
Jadi, cara kerja peningkatan resolusi gambar berbasis AI sebenarnya lebih spesifik daripada sekadar "komputer meningkatkan detail" (penjelasan umum) dan lebih mendekati "sebuah model memprediksi struktur resolusi tinggi yang masuk akal berdasarkan pola yang dipelajarinya dari banyak contoh" ( Deep Learning for Image Super-resolution: A Survey ). Langkah prediksi itulah inti dari semuanya - dan itulah mengapa peningkatan resolusi gambar berbasis AI bisa terlihat menakjubkan… atau sedikit seperti plastik… atau seperti kucing Anda menumbuhkan kumis tambahan.
Artikel-artikel yang mungkin ingin Anda baca setelah ini:
🔗 Bagaimana cara kerja AI?
Pelajari dasar-dasar model, data, dan inferensi dalam AI.
🔗 Bagaimana AI belajar
Lihat bagaimana data pelatihan dan umpan balik meningkatkan kinerja model dari waktu ke waktu.
🔗 Bagaimana AI mendeteksi anomali
Pahami pola dasar dan bagaimana AI dengan cepat menandai perilaku yang tidak biasa.
🔗 Bagaimana AI memprediksi tren
Jelajahi metode peramalan yang mendeteksi sinyal dan mengantisipasi permintaan di masa depan.
Cara kerja AI Upscaling: ide intinya, dalam bahasa sehari-hari 🧩
Peningkatan resolusi (upscaling) berarti meningkatkan ukuran gambar: lebih banyak piksel, gambar lebih besar. Peningkatan resolusi tradisional (seperti bicubic) pada dasarnya meregangkan piksel dan menghaluskan transisi ( interpolasi bicubic ). Ini bagus, tetapi tidak dapat menciptakan baru - hanya melakukan interpolasi.
Peningkatan resolusi gambar dengan AI mencoba sesuatu yang lebih berani (atau disebut juga "super-resolusi" dalam dunia penelitian) ( Pembelajaran Mendalam untuk Super-resolusi Gambar: Sebuah Survei ):
-
Ini memeriksa input beresolusi rendah
-
Mengenali pola (tepi, tekstur, fitur wajah, goresan teks, anyaman kain…)
-
tampilan versi resolusi lebih tinggi seharusnya.
-
Menghasilkan data piksel tambahan yang sesuai dengan pola tersebut
Bukan "mengembalikan realitas secara sempurna," lebih tepatnya "membuat tebakan yang sangat meyakinkan" ( Image Super-Resolution Using Deep Convolutional Networks (SRCNN) ). Jika itu terdengar agak mencurigakan, Anda tidak salah - tetapi itulah mengapa metode ini bekerja dengan sangat baik 😄
Dan ya, ini berarti peningkatan resolusi AI pada dasarnya adalah halusinasi yang terkendali… tetapi dengan cara yang produktif dan tetap menghargai piksel.
Apa yang membuat versi peningkatan resolusi AI menjadi bagus? ✅🛠️
Jika Anda menilai peningkatan resolusi berbasis AI (atau preset pengaturan), berikut adalah hal yang cenderung paling penting:
-
Pemulihan detail tanpa memasak berlebihan.
Peningkatan resolusi yang baik menambahkan kerenyahan dan struktur, bukan noise yang kasar atau pori-pori palsu. -
Disiplin tepi.
Garis yang bersih tetap bersih. Model yang buruk membuat tepi bergoyang atau muncul bintik-bintik di sekelilingnya. -
Realistisnya tekstur.
Rambut tidak seharusnya menjadi sapuan kuas. Batu bata tidak seharusnya menjadi pola berulang seperti stempel. -
Penanganan noise dan kompresi.
Banyak gambar sehari-hari yang dikompresi secara berlebihan menggunakan JPEG. Upscaler yang baik tidak akan memperparah kerusakan tersebut ( Real-ESRGAN ). -
Pengenalan wajah dan teks.
Wajah dan teks adalah tempat termudah untuk menemukan kesalahan. Model yang baik memperlakukannya dengan hati-hati (atau memiliki mode khusus). -
Konsistensi antar frame (untuk video)
Jika detail berkedip dari frame ke frame, mata Anda akan sakit. Peningkatan resolusi video berhasil atau gagal bergantung pada stabilitas temporal ( BasicVSR (CVPR 2021) ). -
Kontrol yang masuk akal.
Anda menginginkan slider yang sesuai dengan hasil nyata: pengurangan noise, penghilangan blur, penghapusan artefak, retensi grain, penajaman… hal-hal praktis.
Sebuah aturan sederhana yang tetap berlaku: peningkatan resolusi "terbaik" seringkali adalah yang hampir tidak Anda sadari. Hasilnya seolah-olah Anda menggunakan kamera yang lebih baik sejak awal 📷✨
Tabel Perbandingan: Opsi peningkatan resolusi AI populer (dan kegunaannya) 📊🙂
Berikut adalah perbandingan praktis. Harga sengaja dibuat tidak pasti karena setiap alat berbeda tergantung lisensi, paket, biaya komputasi, dan hal-hal menarik lainnya.
| Alat / Pendekatan | Terbaik untuk | Suasana harga | Mengapa ini berhasil (secara garis besar) |
|---|---|---|---|
| Aplikasi peningkatan resolusi desktop bergaya Topaz ( Topaz Photo , Topaz Video ) | Foto, video, alur kerja mudah | Dibayar sedikit | Model umum yang kuat + banyak penyesuaian, cenderung "langsung berfungsi"... sebagian besar |
| Fitur tipe “Super Resolution” Adobe ( Adobe Enhance > Super Resolution ) | Fotografer yang sudah berada di ekosistem tersebut | Berlangganan-y | Rekonstruksi detail yang solid, biasanya konservatif (kurang dramatis) |
| Real-ESRGAN / Varian ESRGAN ( Real-ESRGAN , ESRGAN ) | DIY, pengembang, pekerjaan batch | Gratis (tetapi memakan banyak waktu) | Unggul dalam detail tekstur, bisa menghasilkan efek pedas pada wajah jika tidak hati-hati |
| Mode peningkatan skala berbasis difusi ( SR3 ) | Karya kreatif, hasil yang ditata secara artistik | Campur aduk | Bisa menciptakan detail yang menakjubkan - tapi juga bisa mengarang hal-hal yang tidak masuk akal, jadi… ya begitulah |
| Peningkat resolusi game (gaya DLSS/FSR) ( NVIDIA DLSS , AMD FSR 2 ) | Permainan dan rendering waktu nyata | Dibundel | Menggunakan data gerakan dan pengetahuan sebelumnya - performa mulus yang unggul 🕹️ |
| Layanan peningkatan skala cloud | Kemudahan, kemenangan cepat | Bayar per penggunaan | Cepat dan mudah diskalakan, tetapi Anda mengorbankan kendali dan terkadang detail yang halus |
| Pengoptimal resolusi video berbasis AI ( BasicVSR , Topaz Video ) | Cuplikan lama, anime, arsip | Dibayar sedikit | Trik temporal untuk mengurangi kedipan + model video khusus |
| Peningkatan resolusi ponsel/galeri "pintar" | Penggunaan kasual | Termasuk | Model ringan yang disetel untuk menghasilkan suara yang menyenangkan, bukan kesempurnaan (tetap praktis) |
Pengakuan tentang keanehan format: "Paid-ish" melakukan banyak pekerjaan di tabel itu. Tapi Anda mengerti maksudnya 😅
Rahasia besarnya: model mempelajari pemetaan dari resolusi rendah ke resolusi tinggi 🧠➡️🖼️
Inti dari sebagian besar peningkatan resolusi gambar berbasis AI adalah pengaturan pembelajaran terawasi ( Image Super-Resolution Using Deep Convolutional Networks (SRCNN) ):
-
Mulailah dengan gambar beresolusi tinggi (yang disebut "kebenaran")
-
Turunkan resolusinya menjadi versi beresolusi rendah (disebut "input")
-
Latih model untuk merekonstruksi gambar resolusi tinggi asli dari gambar resolusi rendah
Seiring waktu, model tersebut mempelajari korelasi seperti:
-
“Bintik buram di sekitar mata seperti ini biasanya disebabkan oleh bulu mata.”
-
“Kluster piksel ini sering menunjukkan teks serif”
-
“Gradien tepi ini terlihat seperti garis atap, bukan noise acak”
Ini bukan menghafal gambar spesifik (dalam arti sederhana), melainkan mempelajari struktur statistik ( Deep Learning for Image Super-resolution: A Survey ). Bayangkan seperti mempelajari tata bahasa tekstur dan tepi. Bukan tata bahasa puisi, lebih seperti… tata bahasa manual IKEA 🪑📦 (metafora yang agak kaku, tetapi cukup tepat).
Seluk-beluknya: apa yang terjadi selama inferensi (saat Anda melakukan upscaling) ⚙️✨
Saat Anda memasukkan gambar ke dalam perangkat peningkatan resolusi berbasis AI, biasanya ada alur kerja seperti ini:
-
Praproses
-
Konversi ruang warna (terkadang)
-
Normalisasi nilai piksel
-
Bagi gambar menjadi beberapa bagian jika ukurannya besar (uji coba VRAM 😭) ( Repositori Real-ESRGAN (opsi pembagian gambar) )
-
-
Ekstraksi fitur
-
Lapisan awal mendeteksi tepi, sudut, dan gradien
-
Lapisan yang lebih dalam mendeteksi pola: tekstur, bentuk, komponen wajah
-
-
Rekonstruksi
-
Model ini menghasilkan peta fitur dengan resolusi lebih tinggi
-
Kemudian mengubahnya menjadi keluaran piksel yang sebenarnya
-
-
Pasca-pemrosesan
-
Penajaman opsional
-
Pengurangan noise opsional
-
Penekanan artefak opsional (dering, halo, blokade)
-
Satu detail kecil yang perlu diperhatikan: banyak alat memperbesar gambar dalam bentuk ubin, lalu memadukan sambungannya. Alat yang bagus menyembunyikan batas ubin. Alat yang biasa-biasa saja meninggalkan bekas kisi-kisi samar jika Anda menyipitkan mata. Dan ya, Anda akan menyipitkan mata, karena manusia suka memeriksa ketidaksempurnaan kecil pada perbesaran 300% seperti makhluk kecil yang jahat 🧌
Keluarga model utama yang digunakan untuk peningkatan skala AI (dan mengapa terasa berbeda) 🤖📚
1) Super-resolusi berbasis CNN (andalan klasik)
Jaringan saraf konvolusional sangat bagus dalam mengenali pola lokal: tepi, tekstur, struktur kecil ( Image Super-Resolution Using Deep Convolutional Networks (SRCNN) ).
-
Kelebihan: cukup cepat, stabil, lebih sedikit kejutan
-
Kelemahan: bisa terlihat agak "buatan" jika dipaksakan terlalu keras
2) Peningkatan skala berbasis GAN (gaya ESRGAN) 🎭
GAN (Generative Adversarial Networks) melatih generator untuk menghasilkan gambar beresolusi tinggi yang tidak dapat dibedakan oleh diskriminator dari gambar asli ( Generative Adversarial Networks ).
-
Kelebihan: detail yang tajam, tekstur yang mengesankan
-
Kelemahan: dapat mengarang detail yang sebenarnya tidak ada - terkadang salah, terkadang sangat mirip ( SRGAN , ESRGAN )
GAN dapat memberikan ketajaman yang menakjubkan. GAN juga dapat menambahkan alis ekstra pada subjek potret Anda. Jadi… pilihlah prioritas Anda dengan bijak 😬
3) Peningkatan skala berbasis difusi (kartu liar kreatif) 🌫️➡️🖼️
Model difusi menghilangkan noise secara bertahap dan dapat diarahkan untuk menghasilkan detail resolusi tinggi ( SR3 ).
-
Kelebihan: bisa sangat teliti dalam hal detail yang masuk akal, terutama untuk karya kreatif
-
Kelemahan: dapat menyimpang dari identitas/struktur asli jika pengaturannya agresif ( SR3 )
Di sinilah "peningkatan skala" mulai bercampur dengan "penataan ulang". Terkadang, itulah yang Anda inginkan. Terkadang tidak.
4) Peningkatan resolusi video dengan konsistensi temporal 🎞️
Peningkatan resolusi video sering kali menambahkan logika yang peka terhadap gerakan:
-
Menggunakan frame yang berdekatan untuk menstabilkan detail ( BasicVSR (CVPR 2021) )
-
Berusaha menghindari kedipan dan artefak pergerakan
-
Sering menggabungkan resolusi super dengan pengurangan noise dan deinterlacing ( Topaz Video )
Jika peningkatan resolusi gambar diibaratkan memulihkan satu lukisan, peningkatan resolusi video diibaratkan memulihkan buku animasi tanpa membuat bentuk hidung karakter berubah di setiap halaman. Dan itu… lebih sulit daripada kedengarannya.
Mengapa peningkatan resolusi AI terkadang terlihat palsu (dan bagaimana cara mendeteksinya) 👀🚩
Peningkatan resolusi AI gagal dengan cara yang mudah dikenali. Setelah Anda mempelajari polanya, Anda akan melihatnya di mana-mana, seperti membeli mobil baru dan tiba-tiba menyadari model itu ada di setiap jalan 😵💫
Common mengatakan:
-
Mencukur bulu wajah (terlalu banyak menghilangkan noise + menghaluskan)
-
Halo yang terlalu tajam di sekitar tepi (wilayah "overshoot" klasik) ( Interpolasi bikubik )
-
Tekstur berulang (dinding bata menjadi pola salin-tempel)
-
Kontras mikro yang tajam yang menunjukkan "algoritma"
-
Pengubahan teks di mana huruf-huruf menjadi hampir-huruf (jenis yang terburuk)
-
Pergeseran detail di mana fitur-fitur kecil berubah secara halus, terutama dalam alur kerja difusi ( SR3 )
Bagian yang rumit: terkadang artefak ini terlihat "lebih baik" sekilas. Otak Anda menyukai ketajaman. Tetapi setelah beberapa saat, rasanya... janggal.
Taktik yang bagus adalah memperkecil tampilan dan memeriksa apakah terlihat alami pada jarak pandang normal. Jika hanya terlihat bagus pada perbesaran 400%, itu bukan kemenangan, itu hanya hobi 😅
Cara kerja AI Upscaling: sisi pelatihan, tanpa kerumitan matematika 📉🙂
Pelatihan model super-resolusi biasanya meliputi:
-
Kumpulan data berpasangan (input resolusi rendah, target resolusi tinggi) ( Super-Resolusi Gambar Menggunakan Jaringan Konvolusional Dalam (SRCNN) )
-
Fungsi kerugian yang menghukum rekonstruksi yang salah ( SRGAN )
Jenis kerugian umum:
-
Kehilangan piksel (L1/L2)
Meningkatkan akurasi. Dapat menghasilkan hasil yang sedikit kurang tajam. -
Kehilangan persepsi
membandingkan fitur yang lebih dalam (seperti "apakah ini terlihat mirip") daripada piksel yang tepat ( Kehilangan Persepsi (Johnson et al., 2016) ). -
Kerugian adversarial (GAN)
mendorong realisme, terkadang dengan mengorbankan akurasi literal ( SRGAN , Generative Adversarial Networks ).
Terjadi tarik-menarik yang terus-menerus:
-
Buatlah agar sesuai dengan aslinya
vs -
Buatlah agar terlihat menarik secara visual.
Berbagai alat memiliki posisi yang berbeda pada spektrum tersebut. Dan Anda mungkin lebih menyukai satu alat tergantung pada apakah Anda sedang memulihkan foto keluarga atau mempersiapkan poster di mana "tampilan yang bagus" lebih penting daripada akurasi forensik.
Alur kerja praktis: foto, hasil pindaian lama, anime, dan video 📸🧾🎥
Foto (potret, pemandangan, foto produk)
Praktik terbaik biasanya adalah:
-
Lakukan pengurangan noise ringan terlebih dahulu (jika diperlukan)
-
Kelas atas dengan suasana konservatif
-
Tambahkan kembali tekstur adonan jika terasa terlalu halus (ya, sungguh)
Biji-bijian itu seperti garam. Terlalu banyak akan merusak makan malam, tetapi jika tidak ada sama sekali rasanya akan hambar 🍟
Hasil pindaian lama dan gambar yang sangat terkompresi
Ini lebih sulit karena model mungkin memperlakukan blok kompresi sebagai "tekstur."
Coba:
-
Penghapusan artefak atau penghilangan blokir
-
Kemudian tingkatkan kualitasnya
-
Kemudian sedikit penajaman (jangan terlalu banyak… saya tahu, semua orang bilang begitu, tapi tetap saja)
Anime dan seni garis
Seni garis memiliki keuntungan sebagai berikut:
-
Model yang mempertahankan tepi yang bersih
-
Pengurangan halusinasi tekstur
. Peningkatan resolusi anime seringkali terlihat bagus karena bentuknya lebih sederhana dan konsisten. (Beruntung.)
Video
Video tersebut menambahkan langkah-langkah tambahan:
-
Hilangkan kebisingan
-
Deinterlace (untuk sumber tertentu)
-
Kelas atas
-
Penghalusan atau stabilisasi temporal ( BasicVSR (CVPR 2021) )
-
Penambahan kembali butiran biji-bijian secara opsional untuk meningkatkan kohesi
Jika Anda mengabaikan konsistensi temporal, Anda akan mendapatkan kedipan detail yang berkilauan itu. Begitu Anda menyadarinya, Anda tidak bisa melupakannya. Seperti kursi berderit di ruangan yang sunyi 😖
Memilih pengaturan tanpa menebak-nebak secara sembarangan (panduan singkat) 🎛️😵💫
Berikut adalah pola pikir awal yang baik:
-
Jika wajah terlihat seperti plastik,
kurangi pengurangan noise, kurangi penajaman, coba model atau mode yang mempertahankan tampilan wajah. -
Jika tekstur terlihat terlalu intens,
turunkan slider "peningkatan detail" atau "pulihkan detail", lalu tambahkan butiran halus setelahnya. -
Jika tepian terlihat bercahaya
, kurangi ketajaman, periksa opsi peredam halo. -
Jika gambar terlihat terlalu "AI",
pilihlah yang lebih konservatif. Terkadang langkah terbaik adalah... mengurangi.
Selain itu: jangan melakukan upscaling 8x hanya karena Anda bisa. Upscaling 2x atau 4x yang bersih seringkali merupakan titik optimal. Lebih dari itu, Anda meminta model untuk menulis fanfiction tentang piksel Anda 📖😂
Etika, otentisitas, dan pertanyaan canggung tentang “kebenaran” 🧭😬
Peningkatan resolusi berbasis AI mengaburkan batasan:
-
Restorasi berarti memulihkan apa yang sebelumnya ada
-
Peningkatan berarti menambahkan apa yang sebelumnya tidak ada
Untuk foto pribadi, biasanya tidak masalah (dan hasilnya bagus). Namun untuk jurnalisme, bukti hukum, pencitraan medis, atau apa pun yang membutuhkan ketelitian… Anda perlu berhati-hati ( OSAC/NIST: Panduan Standar untuk Manajemen Gambar Digital Forensik , Pedoman SWGDE untuk Analisis Gambar Forensik ).
Aturan sederhana:
-
Jika taruhannya tinggi, anggap peningkatan skala AI sebagai ilustrasi , bukan sebagai sesuatu yang pasti.
Selain itu, keterbukaan informasi penting dalam konteks profesional. Bukan karena AI itu jahat, tetapi karena audiens berhak mengetahui apakah detail tersebut direkonstruksi atau direkam. Itu hanyalah... bentuk penghormatan.
Catatan penutup dan rangkuman singkat 🧡✅
Jadi, cara kerja peningkatan resolusi gambar menggunakan AI adalah sebagai berikut: model mempelajari bagaimana detail resolusi tinggi cenderung berhubungan dengan pola resolusi rendah, kemudian memprediksi piksel tambahan yang masuk akal selama peningkatan resolusi ( Pembelajaran Mendalam untuk Peningkatan Resolusi Gambar: Sebuah Survei ). Tergantung pada jenis modelnya (CNN, GAN, difusi, video-temporal), prediksi tersebut bisa konservatif dan akurat… atau berani dan terkadang tidak masuk akal 😅
Ringkasan singkat
-
Peningkatan resolusi tradisional meregangkan piksel ( interpolasi bikubik ).
-
Peningkatan resolusi gambar menggunakan AI memprediksi detail yang hilang dengan menggunakan pola yang dipelajari ( Image Super-Resolution Using Deep Convolutional Networks (SRCNN) ).
-
Hasil yang bagus berasal dari model yang tepat + pengendalian diri
-
Perhatikan adanya halo, wajah seperti lilin, tekstur berulang, dan kedipan dalam video ( BasicVSR (CVPR 2021) ).
-
Peningkatan skala seringkali merupakan “rekonstruksi yang masuk akal,” bukan kebenaran sempurna ( SRGAN , ESRGAN ).
Jika Anda mau, beri tahu saya apa yang ingin Anda perbesar (wajah, foto lama, video, anime, hasil pindaian teks), dan saya akan menyarankan strategi pengaturan yang cenderung menghindari jebakan umum "tampilan AI" 🎯🙂
Pertanyaan yang Sering Diajukan (FAQ)
Peningkatan skala AI dan cara kerjanya
Peningkatan resolusi gambar menggunakan AI (sering disebut "super-resolusi") meningkatkan resolusi gambar dengan memprediksi detail resolusi tinggi yang hilang dari pola yang dipelajari selama pelatihan. Alih-alih hanya meregangkan piksel seperti interpolasi bikubik, sebuah model mempelajari tepi, tekstur, permukaan, dan goresan seperti teks, kemudian menghasilkan data piksel baru yang selaras dengan pola yang dipelajari tersebut. Ini bukan sekadar "memulihkan realitas" tetapi lebih kepada "membuat tebakan yang meyakinkan" yang terlihat alami.
Peningkatan skala AI dibandingkan dengan pengubahan ukuran bikubik atau tradisional
Metode peningkatan resolusi tradisional (seperti bicubic) sebagian besar melakukan interpolasi antar piksel yang ada, menghaluskan transisi tanpa menciptakan detail baru yang sebenarnya. Peningkatan resolusi berbasis AI bertujuan untuk merekonstruksi struktur yang masuk akal dengan mengenali isyarat visual dan memprediksi seperti apa tampilan versi resolusi tinggi dari isyarat tersebut. Itulah mengapa hasil AI dapat terasa jauh lebih tajam, dan juga mengapa hasil tersebut dapat menimbulkan artefak atau "menciptakan" detail yang tidak ada dalam sumber aslinya.
Mengapa wajah bisa terlihat seperti lilin atau terlalu halus?
Wajah yang tampak seperti lilin biasanya dihasilkan dari pengurangan noise dan penghalusan yang agresif yang dipadukan dengan penajaman yang menghilangkan tekstur kulit alami. Banyak alat memperlakukan noise dan tekstur halus secara serupa, sehingga "membersihkan" gambar dapat menghilangkan pori-pori dan detail halus. Pendekatan umum adalah mengurangi pengurangan noise dan penajaman, menggunakan mode yang mempertahankan wajah jika tersedia, kemudian menambahkan sedikit butiran agar hasilnya terasa kurang artifisial dan lebih fotografis.
Artefak umum peningkatan skala AI yang perlu diwaspadai
Ciri khasnya meliputi lingkaran cahaya di sekitar tepi, pola tekstur yang berulang (seperti pola bata salin-tempel), kontras mikro yang kasar, dan teks yang berubah menjadi "hampir huruf". Dalam alur kerja berbasis difusi, Anda juga dapat melihat pergeseran detail di mana fitur-fitur kecil berubah secara halus. Untuk video, kedipan dan detail yang bergerak lambat di seluruh frame adalah tanda bahaya besar. Jika hanya terlihat bagus pada zoom ekstrem, pengaturan mungkin terlalu agresif.
Perbedaan hasil yang cenderung dihasilkan oleh GAN, CNN, dan diffusion upscaler
Super-resolusi berbasis CNN cenderung lebih stabil dan lebih mudah diprediksi, tetapi dapat terlihat "terproses" jika dipaksakan terlalu keras. Opsi berbasis GAN (gaya ESRGAN) sering menghasilkan tekstur yang lebih tajam dan ketajaman yang lebih baik, tetapi dapat menghasilkan detail yang tidak akurat, terutama pada wajah. Peningkatan skala berbasis difusi dapat menghasilkan detail yang indah dan masuk akal, namun dapat menyimpang dari struktur aslinya jika pengaturan panduan atau kekuatan terlalu kuat.
Strategi pengaturan praktis untuk menghindari tampilan yang “terlalu AI”
Mulailah dengan konservatif: tingkatkan skala 2× atau 4× sebelum menggunakan faktor ekstrem. Jika wajah terlihat seperti plastik, kurangi pengurangan noise dan penajaman, lalu coba mode pengenalan wajah. Jika tekstur terlalu intens, kurangi peningkatan detail dan pertimbangkan untuk menambahkan butiran halus setelahnya. Jika tepian bersinar, kurangi penajaman dan periksa halo atau penekanan artefak. Dalam banyak alur kerja, "lebih sedikit" lebih baik karena mempertahankan realisme yang dapat dipercaya.
Menangani hasil pindaian lama atau gambar yang dikompresi JPEG secara berlebihan sebelum melakukan peningkatan resolusi
Gambar terkompresi agak rumit karena model dapat memperlakukan artefak blok sebagai tekstur nyata dan memperkuatnya. Alur kerja umum adalah penghapusan artefak atau penghilangan blok terlebih dahulu, kemudian peningkatan resolusi, dan kemudian penajaman ringan hanya jika diperlukan. Untuk hasil pemindaian, pembersihan yang lembut dapat membantu model fokus pada struktur sebenarnya daripada kerusakan. Tujuannya adalah untuk mengurangi "petunjuk tekstur palsu" sehingga upscaler tidak dipaksa untuk membuat tebakan yang tepat dari input yang bising.
Mengapa peningkatan resolusi video lebih sulit daripada peningkatan resolusi foto?
Peningkatan resolusi video harus konsisten di seluruh frame, bukan hanya bagus pada satu gambar diam. Jika detail berkedip dari frame ke frame, hasilnya akan cepat mengganggu. Pendekatan yang berfokus pada video menggunakan informasi temporal dari frame tetangga untuk menstabilkan rekonstruksi dan menghindari artefak berkedip. Banyak alur kerja juga mencakup pengurangan noise, deinterlacing untuk sumber tertentu, dan pengenalan kembali butiran opsional sehingga seluruh rangkaian terasa kohesif dan bukan tajam secara artifisial.
Kapan peningkatan skala AI tidak tepat atau berisiko untuk diandalkan?
Peningkatan resolusi AI sebaiknya dianggap sebagai penyempurnaan, bukan bukti. Dalam konteks yang berisiko tinggi seperti jurnalisme, bukti hukum, pencitraan medis, atau pekerjaan forensik, menghasilkan piksel yang "meyakinkan" dapat menyesatkan karena dapat menambahkan detail yang tidak terekam. Pendekatan yang lebih aman adalah menggunakannya sebagai ilustrasi dan mengungkapkan bahwa proses AI telah merekonstruksi detail tersebut. Jika keakuratan sangat penting, simpan dokumen asli dan dokumentasikan setiap langkah dan pengaturan pemrosesan.
Referensi
-
arXiv - Pembelajaran Mendalam untuk Super-resolusi Gambar: Sebuah Survei - arxiv.org
-
arXiv - Peningkatan Resolusi Gambar Menggunakan Jaringan Konvolusional Dalam (SRCNN) - arxiv.org
-
arXiv - Real-ESRGAN - arxiv.org
-
arXiv - ESRGAN - arxiv.org
-
arXiv - SR3 - arxiv.org
-
Pengembang NVIDIA - NVIDIA DLSS - developer.nvidia.com
-
AMD GPUOpen - FidelityFX Super Resolution 2 - gpuopen.com
-
Akses Terbuka Yayasan Visi Komputer (CVF) - BasicVSR: Pencarian Komponen Esensial dalam Super-Resolusi Video (CVPR 2021) - openaccess.thecvf.com
-
arXiv - Jaringan Adversarial Generatif - arxiv.org
-
arXiv - SRGAN - arxiv.org
-
arXiv - Kehilangan Persepsi (Johnson dkk., 2016) - arxiv.org
-
GitHub - Repositori Real-ESRGAN (opsi tile) - github.com
-
Wikipedia - Interpolasi bikubik - wikipedia.org
-
Topaz Labs - Topaz Photo - topazlabs.com
-
Topaz Labs - Video Topaz - topazlabs.com
-
Pusat Bantuan Adobe - Adobe Enhance > Resolusi Super - helpx.adobe.com
-
NIST / OSAC - Panduan Standar untuk Manajemen Citra Digital Forensik (Versi 1.0) - nist.gov
-
SWGDE - Pedoman Analisis Citra Forensik - swgde.org