Cercar Error
Vull col·legiar-me
L'Informatiu intel·ligència artificial

L’arquitecte tècnic centaure

Identificació de ciment aluminós amb intel·ligència artificial

Escrit per -

Si fa mig segle hagués existit Twitter, estic ben segur de què el hashtag #CentauroGasset hauria estat trending tòpic per les repercussions que varen tenir les publicacions del filòsof. La idea del “centaure ontològic” d’Ortega i Gasset és una metàfora que va utilitzar per descriure la naturalesa humana com una combinació de dues dimensions: la racional i la vital. Segons aquesta concepció, l’ésser humà és un ésser híbrid, que uneix la raó i l’instint, la tecnologia i la natura, la ciència i l’art. Vull entendre aquest concepte també com símbol de la dualitat de l’individu com l’evolució contínua de l’ésser humà, d’acord amb la seva naturalesa més bruta i pura, en combinació amb les més modernes tecnologies, invents i mètodes socials.

A una nota preliminar de la seva obra es condensa l’essència d’aquest concepte: “En el caso de esta meditación sobre la técnica, el análisis que Ortega practica acerca de este fenómeno (…) consiste en una investigación sistemática de la índole propia a la realidad del hombre (…) de la que se deriva la necesidad de la invención técnica para su propia pervivencia (…). Se trata, en suma, de inscribir el hecho de la técnica actual en una antropología filosófica, fundada en su propio sistema filosófico (…)”. Massa dur pels que vàrem estudiar ciències?

La idea del “centaure ontològic” d’Ortega i Gasset és una metàfora que va utilitzar per descriure la naturalesa humana com una combinació de dues dimensions: la racional i la vital

No sé si ens passa a tots els col·legiats i col·legiades, però jo tinc la sensació que en aquest món en el qual ens ha tocat viure, on tot és tan efímer i la transformació és tan ràpida i implacable, hi ha, simplificant, tres formes d’enfrontar-se al principal agent transformador dels darrers anys, les noves tecnologies:

  1. – El primer plantejament pot ser el més humanament comprensible, és aquell que rebutja qualsevol innovació.

L’instint innat d’evitar el canvi, de sortir de la zona de confort. El discurs és sòlid. Les coses han funcionat mitjanament bé des de fa molts anys, el sector és estable tot i els anys alterns de vaques magres i grasses, ens permeten una certa continuïtat a la majoria dels negocis, i el progrés és palpable.

Els canvis socials, les noves tecnologies, els tràmits digitals, la burocràcia, la manca del tracte en persona, les bústies telefòniques […] arraconen l’heroic tècnic que es resisteix

Des d’aquest punt de vista molts dels canvis que es van imposant des de les administracions, les normatives d’obligat compliment o per imposició dels mateixos clients acaben generant un sobreesforç en els treballs fets, i moltes vegades acaba comportant una baixada de rendiment productiu, o de qualitat en el servei. També una apatia per la professió i el sector. Els canvis socials, les noves tecnologies, els nous estàndars de qualitat, els tràmits digitals, la burocràcia draconiana, la manca del tracte en persona, les bústies telefòniques d’atenció al client… arraconen l’heroic tècnic que es resisteix. Com si es tractés d’un gueto urbà existeix un gueto sectorial, potser molt relacionat amb el salt generacional que les noves tecnologies han convertit en un gran abisme. Em trobo al meu dia a dia molts companys en aquest grup que han posat la seva mirada en la jubilació que els alliberarà d’aquesta maleïda transformació.

Per sort, altres herois tècnics d’aquest grup, fan un pas més: han identificat greus deficiències en el nou món que estem construint, i rebutgen el canvi tornant als orígens: l’estoïcisme, la construcció amb materials sostenibles, el disseny tradicional, la cultura de la despesa nul·la, l’ús de materials de quilòmetre zero, l’economia circular, etc. Fugint de tot allò hípertecnològic, o fent servir la tecnologia com a eines per tornar a l’origen.

La proposta majoritària és la que s’ha adaptat al canvi o és directament el canvi. Són els joves (i ja no tan joves) que s’han incorporat al sector i el conjunt de tècnics que han mantingut una formació continuada o un compromís amb la professionalització

  • – La proposta majoritària és la que s’ha adaptat al canvi o és directament el canvi.

Són els joves (i ja no tan joves) que s’han incorporat al sector a les darreres dues dècades, i el conjunt de tècnics que han mantingut una formació continuada o un compromís amb la professionalització. “Be water my friend“. Ja no és el moment d’explicar com la innovació iterativa de la nostra realitat professional s’ha anat transformant pas a pas, norma a norma, capítol a capítol.

En aquest grup es concentra la màxima productivitat, ja que s’adopten nous sistemes ben testejats pels pioners i que han demostrat la seva eficiència, i són sistemes que s’acaben imposant en la resolució de problemes perquè són més àgils, aporten solucions més robustes o simplement són més eficients pel que fa al rendiment del temps dedicat per l’humà.

  • – El darrer plantejament que m’he trobat és el del conjunt de tècnics que abracen les noves tecnologies.

L’abracen com a un germà i l’espremen fins a extreure la darrera gota, saben que allà és on es troba l’especialització extrema, el plaer d’arribar allà on ningú altre ha arribat, aquell pas que avui serà un gran pas per la humanitat encara que demà no serà més que un exercici del paleolític.

L’esperit friqui corre lliure en aquest grup, i en formen part aquells que van instal·lar des de disquets els primers programes de càlcul estructural, els primers que van deixar de banda el ròtring i el parallex, aquells que van començar a compartir els documents al núvol o ja més darrerament aquells que han implantat de forma completa la metodologia BIM, LEAN, o qualsevol altre conjunt de sigles d’origen anglosaxó. El discurs d’aquest grup és el que adopten majoritàriament administracions públiques, estaments polítics i els concurrents de fires i congressos. Les noves fites aconseguides, els objectius a curt termini, i les projeccions d’una societat futurista sempre ajudaran a fer que el discurs sigui més inspirador i atractiu.

Els canvis socials, les noves tecnologies, els tràmits digitals, la burocràcia, la manca del tracte en persona, les bústies telefòniques […] arraconen l’heroic tècnic que es resisteix

Per sort o per desgràcia l’adopció de les noves tecnologies al sector moltes vegades depèn del moment professional en el qual es trobi el tècnic, i pot variar en funció del volum de treball, les expectatives de futur, les ganes de generar un canvi professional, les facilitats institucionals o l’ecosistema professional que l’envolta. Malauradament, no tinc la sensació de què com a societat professional estiguem decidint cap a on volem anar, més aviat la meva percepció indica tot el contrari: no estem sent capaços de modelar voluntàriament el nostre futur.

Experimentar amb la IA

Feta aquesta introducció volia compartir la meva darrera experiència d’experimentació amb la IA que s’ha dut a terme amb l’únic propòsit de conèixer amb més detall les capacitats d’aquesta nova eina en el nostre sector, i que properament publicarà l’editorial Springer sota el títol Building engineering facing the challenges of the 21 st Century.  Inicialment, es va escollir un objectiu qualificable i molt quotidià per l’arquitecte tècnic: la identificació del ciment aluminós partint de dues estratègies diferents: fent servir únicament dades de l’emplaçament [ENTORN] i fent servir únicament imatges [APARENÇA]. Per mesurar l’èxit es va determinar que el percentatge d’encert en la identificació de ciment aluminós seria el millor indicador, tenint en compte com es fa en medicina la minimització dels falsos negatius. Aquest és un primer aprenentatge, per la construcció de la intel·ligència artificial apropiada és necessari determinar de bon començament un valor quantificable de l’èxit o de les recompenses i penalitzacions amb les qual l’eina s’avaluarà.

Malauradament no tinc la sensació de què com a societat professional estiguem decidint cap a on volem anar, més aviat tot el contrari: no estem sent capaços de modelar voluntàriament el nostre futur

Avaluació d’un model d’Intel·ligència Artificial amb valors numèrics estadístics que permeten posar una qualificació comparable amb altres models de la capacitat de predicció de ciment aluminós

La Intel·ligència Artificial té una capacitat principal: l’estadística. És extraordinàriament potent establint correlacions, determinant correspondències, relacionant causes i efectes, i preveient escenaris plausibles. Simplificant, podríem dir que les intel·ligències artificials permeten bàsicament dues coses: trobar el següent element d’una sèrie numèrica donada, d’acord amb unes característiques, i també agrupar un conjunt d’individus diversos en grups coherents i relacionats. El mèrit i la dificultat es troba en dissenyar el conjunt de dades i objectius que s’aprofitin d’aquesta potència de càlcul descomunal per obtenir resultats aprofitables.

El plantejament que volia fer servir la ubicació de l’edifici per predir la presència de ciment CAC [ENTORN] va necessitar un llistat d’ubicacions i l’etiquetatge de cada ubicació amb el tipus de ciment amb el qual estava construït. La IA no pot esbrinar sense més informació si un edifici ha estat construït amb un material o un altre, per això cal primer ensenyar-la a trobar patrons, a trobar correlacions i indicis. El llistat d’ubicacions etiquetats es va generar amb  base al fons propi del meu històric de treballs professionals. Per enriquir el llistat amb les característiques que poden descriure una ubicació, aquelles que podrien, potser, ser les característiques que, de forma individual o combinada, poguessin ajudar a predir la presència de Ciment d’Aluminat de Calci (CAC)), es va generar un sistema que capturava la informació de repositoris oberts. La seu electrònica del Cadastre, Open Data Barcelona, repositoris públics de la Generalitat, l’ICAEN o l’Institut Estadístic, varen ser víctimes d’aquest assalt massiu per obtenir dades. Són sistemes pensats per compartir molta informació mitjançant consultes automatitzades, precisament amb aquest tipus de propòsits d’anàlisis i transparència pública. 8 línies de codi en qualsevol llenguatge de programació ens donen accés a una ingent quantitat de dades: 

#función para cargar datos SHP desde open data Barcelona

def cargo_SHP_opendata_bcn(id):

  import json

  import requests

  url = “https://opendata-ajuntament.barcelona.cat/data/api/action/datastore_search?resource_id=” + id 

  response=requests.get(url)

  data=response.json()

  data

  return data

Extracte d’un codi Python per consultar el repositori obert d’Open Data Barcelona

Imatge generada amb les dades obtingudes mitjançant consulta al repositori d’Open Data Barcelona, en concret s’ha senyalitzat les àrees geomètriques en les que es divideix la ciutat de Barcelona, i les seves seccions censals.

Un cop va estar generat el llistat de 500 mostres enriquides amb 53 característiques (edat de l’edifici, superfície, percentatge de lloguer, renda per càpita, distribució d’usos, certificació energètica, partit polític predominant, etc), es fa un tren d’entrenament i un tren de validació. És a dir, part del llistat es fa servir per entrenar i part del llistat es fa servir per avaluar l’èxit de l’algoritme. Es fa de forma iterativa en cicles de prova i error, i saltejant les mostres entre entrenament i validació, fins a obtenir un algoritme optimitzat.

En concret es van fer servir alguns dels algoritmes de classificació supervisada més coneguts i estesos: regressió lògica, arbre de decisió, bosc aleatori o Random Forest, K-veïns, potenciació del gradient o Gradient Boosting, Màquines de Vector Suport o SVC (lineal i radial) i Naive Bayes. Sense entrar en el detall dels resultats obtinguts, que resulten molt interessants i permeten un anàlisis a banda, es pot destacar com a conclusió que més enllà de l’any de construcció de l’edifici, la resta de característiques relacionades amb la ubicació produeixen poca capacitat de predicció. És a dir, no té cap sentit l’estigma social generat envers alguns barris o districtes perquè no hi ha relació entre la ubicaciót d’un edifici i el fet d’estar construït o no amb ciment aluminós.

L’anàlisi de l’estructura

Pel segon plantejament, aquell que fa servir l’aspecte d’una petita mostra de l’estructura [APARENÇA] es va poder comptar amb la incommensurable ajuda de l’Escola Politècnica Superior d’Edificació de Barcelona (EPSEB) i concretament del personal del Laboratori de Materials, que van ajudar a crear les sèries de fotografies forenses de les mostres. Durant un període pràcticament d’un any es van recopilar 3 sèries fotogràfiques amb imatges de baixa qualitat de la cara exterior de les mostres, de la cara interior de les mostres, i de mostres polvoritzades. Les condicions per fer les fotografies van intentar simular les condicions de les preses de dades de camp, i per tant es va forçar la generació de defectes de diversos tipus. Posteriorment, per millorar la qualitat, i sobretot uniformitzar les mostres es varen desenvolupar una sèrie de processos de preprocessat fotogràfic que afectaven l’escala, la perspectiva, el contrast, la intensitat, la distribució de l’histograma o l’enfocament de contorns. Cada un dels processos es va implementar mitjançant fragments de codi Python que es van executar sobre el servei de subscripció de Google Colab Pro+, que es un entorn molt conegut dins l’àmbit acadèmic.

Quan ja es va comptar amb el conjunt de fotografies generat i millorat és quan entra en joc la Intel·ligència Artificial. Potser una de les millors opcions per la classificació d’imatges és l’ús de les xarxes neuronals. Es van dissenyar diverses xarxes neuronals convolucionals (CNN) que van ser entrenades amb les sèries fotogràfiques per predir l’existència o no de CAC. Les xarxes dissenyades van rebre imatges de 300 x 300 píxels, en tres canals, i estaven formades per una triple seqüència de capes de geometries cada vegada més petites, i una capa final que retorna el valor de classificació 0 o 1. Ciment aluminós o no.

Esquema representatiu del procés transformador d’una xarxa neuronal convolucional. La transformació interior de la xarxa és una capsa negra i es desconeix el perquè del seu comportament

Aquí és on comença la màgia del càlcul computacional. Amb aquell escenari amb milers de fotografies originals, amb desenes de variants de les fotografies originals amb diferents nivells de preprocessat, amb diversos dissenys de xarxes neuronals amb diferents configuracions i funcions accessòries i un sistema per avaluar els resultats, semblava que havia arribat el moment de posar a les màquines a fer el seu treball. Amb una iteració darrera d’una altra, de forma inesgotable, es va deixar l’equip treballant durant setmanes fins a trobar les millors  configuracions i els millors resultats. La millor seqüència és el millor algoritme, aquella que té millor encert en la predicció de ciment CAC amb menys falsos negatius. Són diverses les configuracions que van obtenir mètriques per sobre del 90% d’exactitud. Les 5 millors superen el 93%, i la millor assoleix un 96,5% d’exactitud en la identificació de ciment aluminós amb  base a una imatge facilitada. Una vegada obtingut l’algoritme, aquest és molt ràpid d’aplicació i fàcilment integrable en qualsevol dispositiu i procés.

Dins del sector AEC (Arquitectura, Enginyeria i Construcció), les possibilitats de les tecnologies avançades de càlcul computacional que han quedat acreditades durant l’experimentació explicada obren un infinit ventall de possibilitats per al desenvolupament d’aplicacions. Només en aspectes relacionats amb les dades d’entorn i la predicció basada en la percepció computacional, ens trobem amb una llista interminable de possibles utilitats pràctiques.

La revolució del model GPT-4

Quan vaig començar l’article, a finals del 2022, la intel·ligència artificial estava en plena ebullició divulgativa i ens sorprenia cada dia amb novetats i noves fites assolides. Sobretot en el camp de la interpretació del llenguatge natural i la generació d’imatges. La velocitat evolutiva, impulsada per la batalla tecnològica de les grans empreses del sector, s’ha accelerat darrerament i són veritablement sorprenents les capacitats dels darrers sistemes. La setmana del 13 de març de 2023 es va publicar el que podria ser considerat el model més avançat d’IA,  GPT-4. Generative Pre-trained Transformer o GPT és una família de models de llenguatge natural basats en xarxes neuronals desenvolupats per OpenAI. Els models GPT utilitzen l’arquitectura Transformer, que és una xarxa neuronal que funciona especialment bé per a tasques de processament de llenguatge natural. Els models GPT són preentrenats amb grans quantitats de dades textuals no etiquetades, com ara textos de la web o llibres, i després poden ser afinats per a tasques específiques, com ara generació de text, traducció automàtica o classificació de text. Aquest model multicanal, permet interacció amb text i imatges, i demostra que és capaç de:

  • Tenir coneixements generals que permeten que superi exàmens universitaris de qualsevol matèria, situant-se en el percentil 95% dels alumnes humans.
  • Tenir una finestra d’entorn, el que es coneix com el context d’una conversa, de l’equivalent a 50 fulls de text. Això vol dir que podria ser capaç d’analitzar qualsevol document basant-se en un context gran (normativa, instrucció, limitació, objectiu, etc). Suposa quadruplicar la finestra del model de fa 5 mesos.
  • Entendre imatges de qualsevol mena i analitzar el contingut, per identificar elements, diferenciar zones i extreure contingut en format text o geomètric.
  • Generar respostes en format text, ja sogui prosa, poesia, música o llenguatge de programació màquina. Igualment pot generar respostes en format gràfic, ja siguin com a croquis a mà, aquarel·la, render, hiperrealista o qualsevol altre estil indicat.

S’han publicat experiments amb aquest model, on la IA fa un exuberant exercici de creativitat (o potser plagi planetari), ja que partint d’un breu esbós de la silueta d’un xalet a ma alçada és capaç d’interpretar la voluntat del dibuixant i generar milers de propostes hiperrealistes de possibles construccions amb diferents combinacions de materials i interpretació dels volums.

Com a conclusió destaquem que no té cap sentit l’estigma social generat envers alguns barris o districtes perquè no hi ha relació entre l’emplaçament d’un edifici i el fet d’estar construït o no amb ciment aluminós

Per tancar l’article, he volgut donar-li l’oportunitat a la intel·ligència d’OpenAI de dir la seva. En demanar-li “vull un paràgraf per tancar l’article on deixi una pregunta intrigant a l’aire” m’ha retornat el següent text, al qual no afegiré res:

 “En conclusió, l’arquitectura tècnica i la intel·ligència artificial són un exemple fascinant de com les capacitats humanes i la tecnologia poden unir-se per crear solucions innovadores per a les necessitats arquitectòniques. No obstant això, a mesura que la tecnologia continua avançant i la intel·ligència artificial es converteix en una eina cada vegada més omnipresent en la vida quotidiana, és legítim preguntar-nos: fins a quin punt la tecnologia pot reemplaçar la creativitat i el disseny humà en l’arquitectura? Serem capaços de mantenir la nostra naturalesa “centaure ontològic” en un futur cada vegada més automatitzat? Aquestes són preguntes que, sense dubte, continuaran aixecant interès i reflexió en el futur.”

PUBLICITAT