
NTN 366 - 💥 De DeepSeek a Gemini: Guerra de los Modelos 4q1420
Descripción de NTN 366 - 💥 De DeepSeek a Gemini: Guerra de los Modelos 5d585k
Este contenido se genera a partir de la locución del audio por lo que puede contener errores.
Buenas, buenas, bienvenidos a otro episodio de No Tiene Nombre, el único podcast donde la IA nos ha superado a todos. En realidad todos soy solamente yo, y no es un gran hito porque pasarme a mí no es la gran cosa, pero como hoy vamos a hablar de varias noticias y de muchos modelos, pues cargadito que viene el episodio de hoy. Modelos, clones y así protocolos. Empezamos con los amigos de DeepSeek, del que ya hablamos hace un mesecito, donde explicamos lo nuevo que tenía y demás.
Y arrancamos con la presentación del modelo de la semana pasada, que fue uno de los grandes. Hubo tres, hubo muchas presentaciones, pero yo me quedo con tres. Esta es una de ellas, que es DeepSeek V3. DeepSeek V3, el modelo que sale también de los amigos de DeepSeek y entre otras cosas, porque después vamos a hablar un poco de la generación, sigue siendo un modelo entrenado en modo barato.
El bicho es grande, tiene 236 mil millones de parámetros y tiene también el mismo concepto del Moe, del Mixture of Esper, que como comentamos, cómo funcionaba el modelo este antes. Y costó, según lo que dicen, 5.6 millones. Fue entrenado utilizando chips NVIDIA H800 y bueno, el tema de en los Benchmark como MMLU, HumanEval y demás, está compitiendo con los grandes.
Si tienes una máquina que te lo permita, te recomiendo bajarte y darle una prueba en local porque es muy, muy bueno. Otro de estos dos que siguen, estos no te los vas a poder bajar en local, pero realmente reventaron todo. Por un lado, Gemini 2.5, que ahora Google está empezando. O sea, Google está un poquito atrás, el que está muy atrás en la carrera así son nuestros amigos de Apple, pero Google tira magia como Harry Potter y ahora y saca la versión más pro hasta ahora de la serie de modelos que es el modelo Gemini 2.5. Hasta donde entiendo, porque yo no lo tengo, solamente está disponible para suscriptores.
El modelo que tienen son Gemini Advance, te cobran por la magia, así es como Howard y es muy bueno en lo que son tareas de codificación, razonamiento y para trabajar con archivos. Parece que lo que hace de rack es realmente brutal y también lo que parece que tienen este modelo de nuevo yo este no lo he probado, es que hace tiene el tema del reasoning del razonamiento. Ellos le llaman deliberación interna y lo hace bastante, bastante bien antes de dar una respuesta. Así que si estás utilizando Android también, Gemini reemplazó a Google Assistant y ahí te lo puedes encontrar. Yo lo vi el otro día en mi Android y bastante contento que esto.
Por otra parte, si hablamos de modelos grandes y hablamos de modelos buenos, OpenAI siempre está ahí y los amigos de OpenAI reventaron esta semana el mercado con GPT-4 que ahora también genera imágenes. Este modelo era muy bueno porque es un modelo multimodal de texto y de imágenes, pero ahora también soporta todos los emocionales y video y demás, pero ahora también genera imágenes. Por ahora solamente lo podemos probar en chat GPT. Hoy estoy grabando esto 30 de marzo, le hice unas pruebas con la API hace un par de días, lo pueden ver en mi blog y la API todavía no genera las imágenes, pero la capacidad que tiene para generar imágenes es brutal.
Compite con los grandes que teníamos por ahí en el mercado. Dalitris, Dalitres, perdón, se había quedado un poco atrás, pero GPT-4 es realmente brutal. Es más, la semana pasada todas las redes sociales se llenaron de imágenes generadas con GPT-4 en chat GPT, donde la gente subió una foto y decía pásame esta foto con el formato de los Simpsons o con de Estudio Ghibli o con Funko Pops y demás, y es realmente muy, muy, muy bueno. La calidad que tiene es muy fotorrealista, dame una pizza en la cima de la concagua con Messi y un dragón, te da una cosa que te vuela la cabeza y está bastante, pero bastante bien. Así que por ahora solamente creo que está para s de chat GPT+.
Esta parte no la tengo clara porque yo tengo chat GPT+, no sé si en el normal está, pero cuando esté como API vamos a hacer muchas, muchas cosas. Me salto lo de Zapier porque Zapier metió la pata y presentó una cosa que se llama Multistep Call Protocol M y un mal momento para llamar algo M cuando todos están poniendo de acuerdo que M es Model Context Protocol. Así que a ver Zapier qué hace con esto, pero otra cosita relacionado con modelos es viene de China en realidad, donde por ahora cada vez que hablamos de entrenar modelos y modelos grandes siempre estamos hablando de básicamente de chips de Nvidia, estamos hablando de placas de hardware.
Comentarios de NTN 366 - 💥 De DeepSeek a Gemini: Guerra de los Modelos 69174t