Publications scientifiques

L’année 2024 a été marquée par une série de publications notables du CRIM dans des domaines divers tels que la reconnaissance émotionnelle multimodale, la vérification du locuteur, l’intelligence artificielle pour l’accessibilité, et l’intégration des standards géospatiaux.

Parmi les contributions majeures, on retrouve la présentation de travaux innovants dans des conférences internationales prestigieuses telles que l’IEEE CVPR, ISCA ICASSP, et NeurIPS.

En particulier, des études sur l’utilisation de l’attention croisée pour la fusion audio-visuelle dans la reconnaissance émotionnelle, ainsi que des recherches sur la robustesse des systèmes de vérification du locuteur face au bruit d’étiquetage, ont été publiées.

Le CRIM a également contribué à la littérature scientifique sur les modèles de diffusion pour la détection des hypertrucages et a participé activement aux discussions sur les enjeux éthiques de l’intelligence artificielle, notamment lors de séminaires sur l’IA responsable. Ces réalisations soulignent l’engagement du CRIM à mener des recherches de pointe en intelligence artificielle tout en s’assurant que ces innovations répondent aux besoins sociétaux et éthiques actuels.

Livre blanc sur l’IA de confiance

Le CRIM a produit un livre blanc sur l’IA de confiance, destiné à orienter les acteurs de l’innovation dans l’intégration responsable de l’intelligence artificielle. Structuré en trois volets, ce document propose d’abord une réflexion sur les principes directeurs de l’IA de confiance, en mettant en lumière les enjeux éthiques, techniques et sociaux liés à la fiabilité des systèmes intelligents. Il offre ensuite un guide méthodologique structuré, décrivant les pratiques à adopter à chaque étape du cycle de développement, de la planification au déploiement. Enfin, le livre blanc s’appuie sur plusieurs études de cas illustrant concrètement l’application de ces principes dans divers domaines, notamment la prise de décision automatisée, l’assurance qualité, les assistants intelligents et la vérification biométrique.

Revues avec comité de lecture

Balafrej, I., Dahmane, M., “Enhancing practicality and efficiency of deepfake detection”. Scientific Report, 14(1), 31084 (2024). https://doi.org/10.1038/s41598-024-82223-y

Rajasekhar, G. P., and Alam, J., “Incongruity-Aware Cross-Modal Attention for Audio-Visual Fusion in Dimensional Emotion Recognition”. IEEE Journal of Selected Topics in Signal Processing (JSTSP), June, 2024. DOI : 10.1109/JSTSP.2024.3422823

Actes de conférence, colloques et ateliers

Alam, J., Alam, Md Shahidul. “On the Influence of CNN-based Feature Learning Modules in Neural Speaker Verification Framework”. In SPECOM,Crowne Plaza, Belgrade, Serbia, 25-28 November 2024. https://doi.org/10.1007/978-3-031-78014-1_12

Alam, J. et. Al. “ABC System Description for NIST SRE 2024”. In NIST SRE 2024 Workshop, San Juan, Puerto Rico, p. 1-9, December 3-4, 2024.

Charette-Migneault, F., Avery, R., Pondi, B., Omojola, J., Vaccari, S., Membari, P., … & Sundwall, J. “Machine Learning Model Specification for Cataloging Spatio-Temporal Models (Demo Paper)”. In Proceedings of the 3rd ACM SIGSPATIAL International Workshop on Searching and Mining Large Collections of Geospatial Data, October 2024, pp. 36-39. https://doi.org/10.1145/3681769.3698586

Fathan, A. and Alam, J. “Self-supervised Speaker Verification Employing a Novel Clustering Algorithm”. In Proceedings of the IEEE ICASSP, Seoul, South Korea, April 24-19, 2024. DOI : 10.1109/ICASSP48485.2024.10447101

Fathan, A. and Alam, J. “An investigative study of the effect of several regularization techniques on label noise robustness of self-supervised speaker verification systems”. In Proceedings of the ISCA ODYSSEY Speaker and Language Recognition Workshop, Quebec City, Quebec, Canada, 18-21 June 2024. DOI : 10.21437/odyssey.2024-7

Fathan, A. and Alam, J. “Contrastive Information Maximization Clustering for Self-Supervised Speaker Recognition”. In Proceedings of the IEEE Conference on Artificial Intelligence (IEEE CAI), Singapore, 25-27 June 2024. DOI Bookmark : 10.1109/CAI59869.2024.00077

Fathan, A. and Alam, J. “On the influence of metric learning loss functions for robust self-supervised speaker verification to label noise”. In Proceedings of the IEEE Conference on Artificial Intelligence (IEEE CAI), Singapore, 25-27 June 2024. DOI : 10.1109/CAI59869.2024.00186

Fathan, A. and Alam, J. “On the impact of several regularization techniques on label noise robustness of self-supervised speaker verification systems”. In Proceedings of the ISCA INTERSPEECH, Kos Island, Greece, September 1-5, 2024.

Fathan, A., Zhu, X, and Alam, J. “Enhanced label noise robustness through early adaptive filtering for the self-supervised speaker verification task”. In NeurIPS 4th Efficient Natural Language and Speech Processing Workshop, Vancouver, Canada, 10-15 December 2024.

Ganguly, R., Dian Bah, M., Dahmane, M. “Diffusion Models as a Representation Learner for Deepfake Image Detection”. In Proceedings Pattern Recognition: 27^th International Conference, ICPR 2024, Kolkata, India, December 1-5, 2024, Proceedings, Part XXI. https://doi.org/10.1007/978-3-031-78305-0_15

Gupta, V. (2025). “Advances in OpenASR21 Evaluation with Increased Temporal Resolution for Speech Self-supervised Learning Models”. In Karpov, A., Delić, V. (eds) Speech and Computer. SPECOM 2024. Lecture Notes in Computer Science(), vol 15299. Springer, Cham. https://doi.org/10.1007/978-3-031-77961-9_5

Moubtahij, A., Cummings, C.-W., Handan, A., Galy, E., Charton, E. « Participation du CRIM à DEFT 2024 : Utilisation de petits modèles de Langue pour des QCMs dans le domaine médical ». In Actes du Défi Fouille de Textes@TALN 2024, pages 11–22, Toulouse, France. ATALA and AFPC. https://aclanthology.org/2024.jeptalnrecital-deft.2.pdf

Praveen Rajasekhar, G. and Alam, J. “Dynamic Cross Attention for Audio-Visual Person Verification”. Accepted for publication in the IEEE Conference on Automatic Face and Gesture Recognition, Istanbul, Turkey, 27-31 May 2024. https://doi.org/10.48550/arXiv.2403.04661

Praveen Rajasekhar, G. and Alam, J. “Audio-Visual Person Verification based on Recursive Fusion of Joint Cross-Attention”. Accepted for publication in the IEEE Conference on Automatic Face and Gesture Recognition, Istanbul, Turkey, 27-31 May 2024. https://doi.org/10.48550/arXiv.2403.04654

Praveen Rajasekhar, G. and Alam, J. “Recursive Joint Cross-Modal Attention for Multimodal Fusion in Dimensional Emotion Recognition”. In the IEEE Computer Vision and Pattern Recognition (IEEE CVPR) Workshop (6th ABAW), Seattle, USA, 17-21 June 2024. https://doi.org/10.48550/arXiv.2403.13659

Praveen Rajasekhar, G. and Alam, J. “Cross-Attention is not Always Needed: Dynamic Cross-Attention for Audio-Visual Dimensional Emotion Recognition”. In the IEEE Conference on Multimedia and Expo (IEEE ICME), Niagara Falls, Canada, 15-19 July 2024. https://doi.org/10.48550/arXiv.2403.19554

Praveen Rajasekhar, G. and Alam, J. “Less is Enough: Adapting Pre-trained Vision Transformers for Audio-Visual Speaker Verification”. In NeurIPS 4th Efficient Natural Language and Speech Processing Workshop, Vancouver, Canada, 10-15 December 2024.

Praveen Rajasekhar, G., Alam, J. “Cross-Modal Transformers for Audio-Visual Person Verification”. In Proceedings ofThe Speaker and Language Recognition Workshop (Odyssey 2024), pp. 240-246. DOI:10.21437/odyssey.2024-34

Raymond, C., Ratté, S., & Daoust, M. K. “Merging Roles and Expertise: Redefining Stakeholder Characterization in Explainable Artificial Intelligence”. In 2024 34th International Conference on Collaborative Advances in Software and COmputiNg (CASCON) (pp. 1-7). IEEE, november 2024.

Rapport technique

Lalonde, M., Boulianne, G., Rutherford, N., Beaulieu, M., Ghodrati, H., Dahmane, M., « Désinformation Visuelle et Multimodale: Analyse, enjeux, solutions », Montréal, 86 pages, mars 2025.

Morsli, A., « Développement de composantes d’extraction de contenu sémantique à partir d’enregistrements audio, en vue de leur application à la lutte contre la désinformation », 10 avril 2024.

Praveen Rajasekhar, G. and Alam, J. “Inconsistency-Aware Cross-Attention for Audio-Visual Fusion in Dimensional Emotion Recognition”. In arXiv, June 30, 2024. https://doi.org/10.48550/arXiv.2405.12853

Livre blanc

Sotir, M., Galy, É., Boulianne, G., Charton, É., Charette-Migneault, F., Dahmane, M., Frenette, X., Ghodrati, H., Gierschendorf, J., Handan, A., Lalonde, M., Lyman, J., Moubtahij, A., Queudot, M., Raymond, C., Rebout, L., Savard, M., « L’IA de Confiance – Des Principes à la Pratique », 88 pages, septembre 2024.

Billet

Blanchard, J., Quand l’IA transforme le secteur de l’énergie. Chronique dans Les Connecteurs No. 10, 15 janvier 2025.

Charton, É., Éthique, démocratie et encadrement de l’IA. Chronique dans Les Connecteurs No. 7, 20 novembre 2024.

Charton, É., L’IA est-elle bonne pour votre santé?. Chronique dans Les Connecteurs No. 13, 27 février 2025.

Charton, É., Les enjeux de l’intelligence artificielle dans le contexte municipal. Génial La revue, Dossier spécial, Montréal, printemps 2025.

Gierschendorf, J., Conception des systèmes d’aide à la décision (SAD) dans l’industrie. Chronique dans Les Connecteurs No. 6, 6 novembre 2024.

Ghodrati, H., Une révolution cinématographique. Chronique dans Les Connecteurs No. 14, 24 mars 2025.

Habas, M.-P., De l’académie à l’entreprise : Réussir l’opérationnalisation de l’IA. Chronique dans Les Connecteurs No. 2, 11 septembre 2024.

Raymond, C., L’IA : l’acteur silencieux des élections. Chronique dans Les Connecteurs No. 9, 19 décembre 2024.

Savard, M., L’ère quantique arrive-t-elle enfin? Chronique dans Les Connecteurs No. 8, 5 décembre 2024.

Diaporama

Charrette Migneault, F. “Standards Demo Showcase: Open Science Persistent Demonstrator”. 129^th OGC Member Meeting, Montréal, June 19, 2024. DOI:10.13140/RG.2.2.11244.58245

Charette Migneault, F., “Perspectives on the Integration of OGC Standards to Improve Interoperability of Open Science Data Processing Workflows”. ESIP Meeting, Asheville, NC, July 22-26, 2024. DOI:10.13140/RG.2.2.19252.26243

Charrette Migneault, F. “OGC Testbed-20 Demonstration Days : CRIM Demonstration”. Open Geospatial Consortium Testbed-20, Demo Days. February 24-25, 2025.

Charrette Migneault, F. “Testbed-20 GeoDataCubes Integration Test Results: CRIM Demonstration”. The 131^st OGC Member Meeting, Roma, Lazio, Italy, March 3-6, 2025.

Rapport de veille

Rutherford, N., Lalonde, M. “Navigating the Climate Crisis: Information Integrity and the Challenge of Climate Mis/Disinformation”. Rapport de veille du Laboratoire sur l’intégrité de l’information, octobre 2024.

Saviez-vous que?

En 2017-2018, le CRIM développe des outils prédictifs le Service sécurité incendie de Montréal (SIM) afin de prédire le temps nécessaire pour arriver sur les lieux d’une alerte, à partir d’une caserne, pour une unité du SIM.

← Précédent

Accueil →