Home Tecnologia Il modello conta: ho provato a codificare con Vibe un progetto con...

Il modello conta: ho provato a codificare con Vibe un progetto con diversi modelli Gemini

7
0

Codifica delle vibrazioni può essere molto divertente quando hai la giusta mentalità. Non ci vuole un ingegnere per avere una buona concept che potrebbe trasformarsi in qualcosa di eccezionale, ed è questo che rende così attraente la creazione di app utilizzando solo il linguaggio naturale: chiunque può capirlo. Mi sono dilettato in una discreta quantità di vibrazioni codificando me stesso facendocela calendari degli eventi e ricreare videogiochi per l’infanzia nel mio browser internet, semplicemente chattando con a chatbotma so di aver appena scalfito la superficie.

Atlante dell'intelligenza artificiale

CNET

Il modello utilizzato può avere un impatto drammatico sulla qualità del risultato del progetto e ne sono stato testimone in prima persona. Volevo vedere come si confrontano i modelli più leggeri con i modelli “pensanti”, come li chiamano Google e OpenAI. Questi modelli più leggeri hanno nomi diversi: l’interfaccia Gemini di Google lo chiama Quick (anche se in realtà il modello si chiama, advert esempio, Gemini 2.5 Flash), mentre OpenAI lo chiama Istantaneo.

Per avere un’concept di quanto sia diverso ciascun modello per la codifica delle vibrazioni, ho eseguito un esperimento. Innanzitutto, ho iniziato creando un progetto utilizzando il modello Considering di Gemini – Gemini 3 Professional – e volevo vedere se potevo replicare lo stesso progetto con il modello veloce utilizzando le stesse istruzioni del progetto precedente. Dato che non c’è modo di garantire le risposte per ciascun modello, sapevo che ci sarebbero state variazioni e le conversazioni si sarebbero biforcate, ma per la maggior parte ho cercato di mantenere le conversazioni identiche quando potevo.

Al momento di questo take a look at, il modello veloce period Gemini 2.5 Flash. Mi aspettavo che i risultati finali fossero diversi, e lo erano, ma non così tanto come mi aspettavo. Ciò che è stato diverso è stato il modo in cui sono passato dalla A alla Z con ciascun modello.

Mi mancava l’ispirazione per questo esperimento, quindi l’ho semplicemente scaricato su Gemini. Ho chiesto che presentasse interessanti progetti di codifica delle vibrazioni con cui avrei potuto eseguire e ho optato per uno chiamato “Trophy Show Case”. Ho chiesto a Gemini di visualizzare un elenco di movie horror, anziché di trofei, e di fornire maggiori informazioni su di essi quando si fa clic su uno dei poster. Al di fuori di questi requisiti, ho dato il controllo creativo a entrambi i modelli Gemini.


Non perdere nessuno dei nostri contenuti tecnici imparziali e le recensioni di laboratorio. Aggiungi CNET come fonte Google preferita.


Modelli di intelligenza artificiale veloci e pensanti: qual è la differenza?

Se Google ci offre la possibilità di scegliere tra i modelli Flash e Professional, devono essere sostanzialmente diversi, giusto? Sì e no. Sono entrambi modelli linguistici di grandi dimensioni, ma funzionano in modo diverso. Per l’utente quotidiano, “veloce” e “pensiero” definiscono abbastanza bene le differenze tra i due: velocità contro profondità.

UN modello di ragionamento è un LLM che è stato messo a punto per suddividere problemi complessi in passaggi più piccoli prima di generare l’output finale. Questo viene fatto eseguendo un percorso interno di ragionamento a catena di pensiero. Sia Gemini 2.5 Flash che Gemini 3 Professional sono modelli ragionanti, ma Gemini 2.5 Flash ha una approccio ibrido: Offre a atto di equilibrio tra velocità e ragionamento.

Gemini 3 Professional è il modello di ragionamento più forte ed è ottimizzato per immergersi in profondità per trovare risposte. Di conseguenza, è più lento rispetto ai modelli più efficienti come 2.5 Flash. Da allora Google ha rilasciato Gemelli 3Flashun modello base più potente che ha sostituito 2.5 Flash. Gemini 3 Professional rimane il modello di ragionamento più potente disponibile in Gemini per la maggior parte delle persone.

Il modello Gemini 3 Professional ha svolto la maggior parte del lavoro

Progetto di film di codifica Gemini 3 Pro Vibe

Il progetto finale realizzato da Gemini 3 Professional non period perfetto, ma period migliore della mia concept originale e circa un miglio avanti rispetto a quanto prodotto da Gemini 2.5 Flash.

Google Gemini/Schermata di Blake Stimac/CNET

Utilizzando Gemini 3 Professional, sono stato in grado di creare una pagina di destinazione che mostrava i movie dal mio elenco, completi di immagini di poster, e quando si faceva clic su un titolo, si apriva una pagina che rivelava informazioni aggiuntive, insieme a un collegamento per visualizzare il trailer su YouTube. Non è stato un progetto complicato, ma ho riscontrato molti problemi ed errori lungo il percorso.

Inizialmente volevo che i trailer fossero incorporati nella pagina, ma continuava a segnalare errori che Gemini non period in grado di correggere, quindi ho dovuto ridimensionarli fornendo semplicemente un’immagine collegata per guardare il trailer su YouTube. Andava bene, ma un’esperienza meno fluida di quanto volessi. Detto questo, ho apprezzato il modo in cui Gemini 3 Professional ha dettagliato i problemi specifici riscontrati con questa funzionalità e mi ha permesso di prendere la decisione di eliminarla.

Un altro problema che Gemini 3 Professional ha tentato di risolvere più volte è stato quello descritto come un problema di stratificazione. Facendo clic su un poster, veniva visualizzato un popup con i dettagli del movie, insieme a un piccolo pulsante per uscire da quella visualizzazione, anche se non ha mai funzionato. Ho chiesto a Gemini di risolverlo quattro volte e non è riuscito a risolvere il problema fino all’ultima richiesta. Gemini ha spiegato cosa stava facendo con il codice a grandi linee, ma non è mai entrato troppo nei dettagli, anche se immagino che avrebbe fornito dettagli se glielo avessi chiesto.

Il progetto originale period semplicemente un modo per visualizzare una raccolta di movie e ottenere maggiori informazioni su di essi. A parte questo, non ho pensato a nulla sullo stile o sui modi per rendere interessante l’app Internet e Gemini 3 Professional è stato utile in quest’space. Quando ho chiesto come avrei potuto migliorare l’app, sia nel design che nelle funzionalità, mi ha suggerito di aggiungere un effetto ruota 3D ai movie e un’opzione di selezione casuale.

Questo progetto ha richiesto quasi 20 iterazioni. Il prodotto finale period buono quanto avrebbe ottenuto, ed period un progetto divertente, ma c’erano problemi che Gemini non riusciva a risolvere il più delle volte. Il prodotto finale ha fatto più di quanto mi aspettassi, quindi ne sono rimasto soddisfatto. Ma con tutti i problemi che ho riscontrato, ho iniziato a chiedermi come il veloce modello Gemini avrebbe gestito lo stesso progetto.

La codifica delle vibrazioni con Gemini 2.5 Flash è più manuale

Non sorprende che l’utilizzo del modello “veloce” sia stato più rapido rispetto a Gemini 3 Professional, ma nella maggior parte dei casi questo modello suggeriva approcci più manuali per trovare soluzioni per il progetto. L’intelligenza artificiale ha funzionato rapidamente, ma ha creato più lavoro, e più lentamente, per me.

Advert esempio, volevo che l’app Internet mostrasse sia il poster che la sinossi di ciascun movie nell’elenco, ma non avevo mai pensato a come sarebbero state generate tali informazioni. Senza chiederlo espressamente, Gemini 3 Professional mi ha suggerito di iscrivermi Il database dei film e ottieni una chiave API per inserire automaticamente quei dettagli, dove Gemini 2.5 Flash mi ha essenzialmente detto di “acquisire” le immagini e partire da lì. Il modo in cui ho acquisito quelle immagini apparentemente dipendeva da me.

Gemini 2.5 Flash a volte sembra quasi pigro rispetto a Gemini 3 Professional. Ci sono alcune cose che il modello Gemini Professional farà senza che gli venga chiesto, ma Flash necessita di suggerimenti più specifici. A volte, mi sentivo come se stessi spingendo un bambino che ascoltava le istruzioni ma evitava intenzionalmente le sue faccende.

In più casi, dopo aver chiesto a Gemini 2.5 Flash di apportare una modifica, lo ha fatto e ha fornito il codice aggiornato, ma solo per la sezione specifica che aveva modificato. Quindi mi chiederebbe di sostituire il vecchio codice con il nuovo codice. Se sai cosa stai cercando, sostituire una sezione di codice con un’altra probabilmente non è un grosso problema, ma questa è la codifica delle vibrazioni e se non sai dove posizionare il codice, anche se è davvero un compito facile, ciò potrebbe fermare alcune persone nel loro cammino. Può buttare through l’atmosfera.

Inoltre, Gemini 2.5 Flash mi ha semplicemente suggerito di “acquisire” le immagini della locandina del movie e ulteriori dettagli. Quindi, pur oltrepassando i limiti dei parametri dell’esperimento per utilizzare solo gli stessi immediate in entrambi i progetti (che nella migliore delle ipotesi erano vaghi), ho deciso di chiedere a Gemini 2.5 Flash cosa ne pensasse dell’concept di aggiungere la chiave API per The Films Database. Ha accolto con favore l’concept e mi ha detto dove aggiungere la chiave. Invece, ho chiesto al modello di aggiungere la chiave che avevo fornito. Ha aggiunto la chiave, ma quando ho eseguito l’app Internet, in realtà non estraeva le immagini dei poster dai movie che avevo elencato, quindi ho dovuto chiedergli di risolverlo ancora una volta. Il modello alludeva ai suoi limiti dicendo: “Trovare l’ID TMDB esatto per ogni movie nell’elenco originale richiede molto tempo, ma popolerò l’array con il maggior numero possibile di ID confermati per rendere la raccolta accurata rispetto all’elenco richiesto”.

Se avesse fatto qualcosa come aveva detto, non me ne sarei accorto. Rispetto alla vasta gamma di movie diversi che popolavano, qualsiasi corrispondenza dall’elenco che ho fornito sembrava una coincidenza. Tuttavia, anche se il 99% delle locandine dei movie visualizzate erano errate, in teoria mi impediva comunque di aggiungere manualmente le immagini stesse. Al contrario, Gemini 3 Professional ha popolato tutte le locandine dei movie corrette in un colpo solo.

Come differivano i modelli veloce e pensante durante la codifica delle vibrazioni

Ogni volta che chiedevo una modifica al modello di pensiero di Gemini, lui apportava la modifica e riscriveva immediatamente tutto il codice in modo da poter semplicemente copiare e incollare l’intero codice dove volevo senza dover sapere dove period stato aggiornato.

Gemini 2.5 Flash period diverso. Advert un certo punto, dopo aver apportato una piccola modifica, mi ha dato il codice e mi ha detto di sostituirlo con quello che c’period. Sperando di evitare questo, gli ho chiesto di riscrivere l’intero codice in modo da non dover cambiare nulla. La sua risposta: “È una domanda enorme”. Anche se sembrava che credessi che gli stavo chiedendo molto di più in quel momento, è un po’ stridente se paragonato al Gemini 3 Professional.

I progetti

Progetto di film di codifica Flash Vibe Gemini 2.5

Gemini 2.5 Flash ha realizzato un progetto abbastanza realizzabile, ma period pieno di errori anche dopo aver tentato di correggerli.

Google Gemini/Schermata di Blake Stimac/CNET

Alla tremendous dei miei take a look at, nessuno dei due modelli period perfetto, ma lavorare con Gemini 3 Professional è stato molto più semplice. Anche se entrambi i modelli potrebbero, in un altro progetto, produrre risultati molto simili, arrivare alla destinazione finale probabilmente seguirà due percorsi molto diversi.

Lavorando con Gemini 2.5 Flash, devi essere specifico su ciò che vuoi che faccia ed essere pronto a correggerlo quando sembra che prenda scorciatoie. Ci vorrà pratica ed esperienza, compreso il lavoro con altri modelli di intelligenza artificiale, per individuare quando il modello sta prendendo una scorciatoia che potrebbe influenzare il progetto. Se questo è l’unico modello con cui stai lavorando, dovrai essere più diligente nel complesso.

Gemini 3 Professional merita davvero il suo nome. Non solo ha gestito il lavoro pesante di questo progetto, ma ha anche offerto suggerimenti utili che lo hanno elevato rispetto all’concept di base con cui ho iniziato.



fonte

LEAVE A REPLY

Please enter your comment!
Please enter your name here